知识图谱,也称为语义网络,代表现实世界实体(例如对象、事件、情境或概念)组成的网络,并说明了它们之间的关系。这些信息通常存储在图形数据库中,并以图表结构的形式可视化,从而产生了知识“图谱”这一术语。
知识图谱由三个主要组件组成:节点、边缘和标签。任何对象、地点或人物都可能是节点。边缘定义节点之间的关系。例如,节点可能是客户(如 IBM)和代理机构(如 Ogilvy)。边缘是将关系归类为 IBM 与 Ogilvy 之间的客户关系。
A 代表主语,B 代表谓语,C 代表宾语
还值得注意的是,知识图谱的定义各不相同,有研究表明,知识图谱与知识库或知识本体没有什么不同。相反,该研究主张这个词是在 2012 年由 Google 的 Knowledge Graph 推广的。
知识本体在知识图谱的语境中也经常被提及,但同样,关于它们与知识图谱有何不同仍然存在争议。最终,知识本体的作用是为图中的实体创建一个正式的表示形式。它们通常基于分类法,但由于它们可以包含多个分类法,因此它保留了自己单独的定义。由于知识图谱和知识本体以类似的方式(即通过节点和边缘)进行表示,并且都基于资源描述框架 (RDF) 三元组,因此它们在可视化效果中往往彼此相似。
知识本体的一个例子可能是如果我们检查一个特定的场所,比如 Madison Square Garden。知识本体使用变量(如时间)来区分该位置的事件。像 New York Ranger 这样的球队在一个赛季内有一系列比赛将在该赛场举办。它们都是冰球比赛,而且都在同一个场地举行。但是,每个事件都通过日期和时间来区分。
网络本体语言 (OWL) 是广泛采用知识本体的一个例子,它得到万维网联盟 (W3C) 的支持,这是一个倡导互联网长期开放标准的国际社区。最终,这种知识组织由数据库、API 和机器学习算法等技术基础设施支持,它们的存在是为了帮助人们和服务于更有效地访问和处理信息。
知识图谱通常由各种来源的数据集组成,而这些数据集在结构上往往不同。模式、标识和上下文共同为多样化数据提供结构。模式为知识图谱提供了框架,标识对底层节点进行了适当分类,而上下文则决定了知识存在的环境。这些组件有助于区分具有多种含义的单词。这允许产品(如 Google 的搜索引擎算法)确定 Apple 品牌和真正苹果之间的区别。
由机器学习驱动的知识图谱利用自然语言处理 (NLP),通过称为语义丰富的过程构建节点、边缘和标签的全面视图。摄取数据时,此过程允许知识图谱识别单个对象并了解不同对象之间的关系。然后将这些工作知识与其他数据集进行比较和集成,这些数据集在本质上是相关且相似的。知识图谱完成后,它允许问答和搜索系统检索和重用给定查询的全面答案。虽然面向消费者的产品展示了其节省时间的能力,但相同的系统也可以应用于业务环境,消除手动数据收集和整合工作以支持业务决策。
围绕知识图谱的数据整合工作也可以支持新知识的创造,在数据点之间建立以前可能没有认识到的联系。
有许多面向消费者的流行知识图谱,它们为整个企业的搜索系统设定了用户期望。这些知识图谱包括:
然而,知识图谱在其他行业也有应用,例如:
IBM® Granite 是我们开放式、性能优异、值得信赖的 AI 模型系列,专门为企业量身定制,并经过优化,可以帮助您扩展 AI 应用。深入了解语言、代码、时间序列和防护措施选项。
了解自然语言处理如何帮助您与计算机更自然地对话。
我们对 2,000 家组织进行了调查,旨在了解他们的 AI 计划,以发现哪些方法有效、哪些方法无效,以及如何才能取得领先。
深入了解 IBM 开发人员网站,访问博客、文章、时事通讯,并了解更多有关 IBM 嵌入式 AI 的信息。
学习基本概念并通过亲手实验、课程、指导项目、试用等方式培养您的技能。