知识图谱的落地指南
知识图谱技术作为一门新兴的技术,是人工智能技术的重要组成部分,其建立的具有语义处理能力与开放互联能力的知识库,可在智能搜索、智能问答、个性化推荐等智能信息服务中产生应用价值。就覆盖范围而言,知识图谱也可分为通用知识图谱和行业知识图谱。通用知识图谱注重广度,强调融合更多的实体,较行业知识图谱而言,其准确度不够高,并且受概念范围的影响,很难借助本体库对公理、规则以及约束条件的支持能力规范其实体、属性、实体间的关系等。通用知识图谱主要应用于智能搜索等领域。行业知识图谱通常需要依靠特定行业的数据来构建,具有特定的行业意义。行业知识图谱中,实体的属性与数据模式往往比较丰富,需要考虑到不同的业务场景与使用人员。我国对于中文知识图谱的研究已经起步,并取得了许多有价值的研究成果。知识图谱在于对各对象实体关系、属性的链接,在互联网时代,几乎任何实体都能通过一系列的关系属性去连接到一起,那么我们就能通过知识图谱的搭建,去寻找之间的关系,进行一系列的推理,去预测某些知识。因此,在现代社会中,知识图谱在许多领域都能很好地发挥作用,近年来吸引了大量的研究。例如北京理工大学大数据实验室张华平教授研发的KGB知识图谱引擎,采用语义智能分析技术从结构化和半结构化的数据中抽取各类知识,并实现知识关联,推理并实现核查检验。 教育领域在教育行业中,知识图谱可以通过实体间的关系,来对学习路径做一个很好的规划。我们经常谈论个性化教育、因材施教的理念。其核心在于理解学生当前的知识体系,而且这种知识体系依赖于我们所获取到的数据比如交互数据、评测数据、互动数据等等。为了分析学习路径以及知识结构,我们则需要针对于一个领域的概念知识图谱,简单来讲就是概念拓扑结构。比如为了学习逻辑回归则需要先理解线性回归;为了学习CNN,得对神经网络有所理解等等。所有对学生的评测、互动分析都离不开概念图谱这个底层的数据。证券领域在证券领域,我们经常会关心比如“一个事件发生了,对哪些公司产生什么样的影响?” 比如有一个负面消息是关于公司1的高管,而且我们知道公司1和公司2有种很密切的合作关系,公司2有个主营产品是由公司3提供的原料基础上做出来的。其实有了这样的一个知识图谱,我们很容易回答哪些公司有可能会被这次的负面事件所影响。当然,仅仅是“有可能”,具体会不会有强相关性必须由数据来验证。所以在这里,知识图谱的好处就是把我们所需要关注的范围很快给我们圈定。接下来的问题会更复杂一些,比如既然我们知道公司3有可能被这次事件所影响,那具体影响程度有多大? 对于这个问题,光靠知识图谱是很难回答的,必须要有一个影响模型、以及需要一些历史数据才能在知识图谱中做进一步推理以及计算。 领域知识图谱目前在很多行业中已经发挥越来越重要的作用,技术上的挑战也有不断的进展,未来还会有更多的领域知识图谱落地,帮助推动行业应用的智能化。
页:
[1]