语义搜索、智能问答是NLP的关键技术,目的是让用户以自然语言形式提出问题,深入进行语义分析,以更好理解用户意图,快速准确获取知识库中的信息。在用户界面上,既可以表现为搜索引擎的形式(语义检索)、也可以为问答机器人的形式(智能问答)。 在语义搜索方面,使用知识图谱技术搜索得到的信息还可以经过加工后分门别类,比如,负面消息汇总、热点事件、并购事件、公司公告、研究报告、公司上下游、行业规模等等。 问答机器人(智能问答系统)一般包括问句理解、信息检索、答案生成三个环节。问答机器人与金融知识图谱密切相关,知识图谱在语义层面提供知识的表示、存储和推理,问答机器人则从语义层面提供知识检索的入口。基于知识图谱的问答机器人相比基于文本的问答更能满足金融业务实际需求。问答机器人的实现有很多案例,例如siri和微软小冰,但是普遍的效果都不是很好,这个原因来源于他们是通识性的智能助手,需要识别的语义实体太多,难以做到多轮对话、语义消歧的作用,如果只做行业的助手,那么准确率会大大提升。 在发挥处理海量差异性数据优势方面,KGB知识图谱功能很好的发挥了大数据时代的知识图谱构建优势,能够实现以下几种功能: 1. 文档解析: KGB知识图谱引擎,可轻松解析多种格式与版本文档:TXT、DOC、EXCEL、PPT、PDF、XML等。尤其是PDF文件,可直接解析输出为word格式文件,保留文件中表格与文字格式等重要信息。对于图片信息,OCR可自动识别并抽取图片中的文字信息。 2. 知识抽取:KGB知识图谱引擎,可从结构化表格与非结构化文本中自适应识别并抽取关键知识(主体、客体、时间、地点、金额、条款等),准确率高达90%,实现知识的快速生成。 3. 知识关联:KGB知识图谱引擎深入挖掘知识关联,将一个个知识实体链接为具有完整意义的知识事实。并具有强大的知识推理能力,推理出暗含的知识与结论,丰富知识图谱。 4. 知识较验:KGB知识图谱加工厂能够对知识质量智能校验,包括对多种知识错误与冲突进行自动智能核查与修正,更有知识工程师进行知识精准校验,保证知识图谱的准确性。 在应用方面,KGB知识图谱兼具以下特色: 1、跨领域可扩展:知识图谱加工厂具有通用的图谱构建引擎。知识抽取、知识关联与质量核查过程不依赖特定业务知识,结合用户知识图谱构建的需求,可以快速构建用户领域知识图谱。 2、知识质量智能核查:知识图谱加工厂实现对多种知识错误与冲突的智能核查与校验,并对知识库进行实时自动更新,保证知识图谱准确性。 3、人机结合的服务:知识图谱加工场人机构成:90%机器+10%的人工,只需要提供语料,就可以快速得到对应的知识图谱构建成果。
|