📚 知识工程与知识获取:从零到进阶的实用指南!📚

💡 什么是知识工程?
知识工程是通过计算机技术对人类知识进行建模、管理和应用的一门交叉学科。
它不仅仅是编写代码,更是通过构建知识库、实现智能问答、推荐系统等应用,让技术真正服务于人类!💡

🔥 什么是知识获取?
知识获取是从现有数据、文本、图像等多种来源中提取有价值的知识,构建知识表示的过程。
它包括自然语言处理、数据挖掘、机器学习等多种技术!🔥

🔧 知识工程与知识获取的关系
知识工程依赖知识获取,而知识获取又是知识工程的基础。两者相辅相成,共同推动人工智能技术的发展!🔧

💡 知识工程的构建步骤
1️⃣ 需求分析:明确应用场景,确定知识库的范围和目标。
2️⃣ 数据收集:从文本、图像、音频等多种来源获取数据。
3️⃣ 知识表示:选择合适的表示方式,构建知识图谱或实体关系图。
4️⃣ 知识推理:通过逻辑推理或机器学习,扩展知识库。
5️⃣ 知识应用:将知识用于智能问答、推荐系统、决策支持等场景。💡

🔥 知识获取的挑战
1️⃣ 数据质量:如何处理噪声数据和不完整数据?
2️⃣ 语义理解:如何让计算机真正理解人类语言?
3️⃣ 效率问题:如何在大规模数据中高效提取知识?
4️⃣ 模型泛化:如何让模型在不同场景下表现良好?🔥

快来加入我们,一起探索知识工程与知识获取的奥秘!📚
#知识工程 #知识获取 #自然语言处理 #机器学习 #深度学习


在这里插入图片描述
最简单的知识图谱实战教程,浙大教授带你快速入门(附课件)学习视频

知识工程

发展阶段

在这里插入图片描述

知识工程的发展历史可以追溯到20世纪60年代,随着人工智能和计算机技术的快速发展,逐渐成为一门独立的学科。

以下是知识工程发展历史的几个关键阶段和重要发展:
在这里插入图片描述

1. 早期阶段:专家系统
  • 时间范围:20世纪60年代
  • 特点
    • 早期知识工程主要集中在专家系统领域。
    • 通过模拟人类专家的决策过程,解决复杂问题。
    • 依赖于预定义的规则和知识库,利用逻辑推理进行决策。
  • 代表技术
    • MYCIN(医疗诊断)
    • DENDREX(化学反应分析)
    • 智能Shell(如NARS)

2. 符号主义方法
  • 时间范围:20世纪70年代到80年代
  • 特点
    • 强调符号表示和逻辑推理。
    • 将知识表示为符号形式(如逻辑命题、规则、框架等),并通过形式逻辑进行推理。
  • 代表理论
    • 框架理论(Frames):由John McCarthy提出,用于表示事物的状态和行为。
    • 语义网络(Semantic Networks):一种基于图的表示方法,用于表示概念之间的关系。
  • 工具与系统
    • NOLOGIC
    • Production Systems(如MYCIN)
    • KL-ONE

3. 知识工程循环
  • 时间范围:20世纪90年代**
  • 特点
    • 强调知识工程的完整过程,从需求分析到知识实现和应用。
    • 强调与业务流程的结合,注重知识系统的实用性和可扩展性。
  • 核心步骤
    • 需求分析:明确知识需求。
    • 知识获取:从文档、数据中提取知识。
    • 知识表示:将知识符号化。
    • 知识建模:构建知识模型。
    • 知识实现:将知识转化为系统或工具。
    • 知识应用:在实际场景中应用知识系统。
  • 代表工具与方法
    • Kee
    • DAME
    • KRB方法论

4. 现代阶段:数据驱动与智能化
  • 时间范围:20世纪90年代到21世纪**
  • 特点
    • 随着人工智能(AI)和大数据技术的发展,知识工程更加注重数据驱动的知识获取和知识表示。
    • 强调智能化,结合机器学习和深度学习技术,提升知识系统的自动构建和优化能力。
  • 代表技术
    • 知识图谱(Knowledge Graphs):通过图数据库和知识抽取技术,构建大规模的知识库。
    • 自然语言处理(NLP):通过NLP技术提取知识。
    • 深度学习:用于知识表示和推理优化。
  • 应用领域
    • 电商(推荐系统)
    • 教育(智能学习系统)
    • 医疗(知识辅助诊断)
    • 金融(风险评估)

知识汤

在这里插入图片描述

** 知识汤”(Knowledge Soup)** 是一种比喻性的概念,用来描述一种通过整合和组织大量知识,形成一个统一、易于使用的知识平台或系统
它类似于将分散的知识“煮”成一个统一的知识“汤”,方便人们理解和利用这些知识。

在知识工程中,“知识汤” 可以理解为一种整合、管理和应用知识的方法。

它强调将零散的知识点、规则、数据等通过某种方式组织起来,形成一个易于访问和应用的知识体系。这种知识体系可以是基于数据库、语义网络、图数据库或其他技术实现的。

关键点:
  1. 整合性:将分散的知识点整合到一个统一的系统中。
  2. 易用性:提供一个方便的知识获取和应用方式。
  3. 统一性:通过某种结构化的方式,使知识易于管理和扩展。

需要人工整理知识,到知识系统中‘知识汤’

存在如下问题

人类获取知识的瓶颈

在这里插入图片描述

挑战机器自主获取知识的极限

实现机器的感知层面,进而是认知层面

在这里插入图片描述
在这里插入图片描述
让机器更能深层次理解世界深层次的知识。
机器自动化获取知识,还是任重道远。

现在机器还远远无法达到人类预期的效果。自动化理解,认知并获取全世界的所有知识。
进而:简化的知识工程来进行知识获取

知识图谱工程:简化的知识工程

知识图谱 是 简化了的知识工程。

知识图谱工程 是一种利用 知识图谱 技术进行大规模知识抽取、存储和管理的系统工程。知识图谱是一种基于 图结构 的知识表示方法,能够有效整合和表达各种类型的知识。知识图谱工程的核心目标是通过系统化的知识抽取、存储和优化,构建一个高效的知识管理系统,支持知识管理和知识应用
在这里插入图片描述

更加注重依靠大数据自动化的提取知识。
更加注重知识的规模

知识抽取技术
  • 概念抽取
  • 实体抽取
  • 关系抽取
  • 事件抽取
  • 规则抽取
知识的来源

在这里插入图片描述

  1. 结构化数据
  2. 半结构化数据
  3. 非结构化数据

在这里插入图片描述
.
在这里插入图片描述

主要:从文本中获取知识

在这里插入图片描述
在这里插入图片描述
一个事件抽取的过程,可以看成是一组三元组提取的过程

总结

知识图谱 ≠ 专家系统
在这里插入图片描述

Logo

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区,共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐