
第4章 非规范知识表示与处理
知识泛指人类在实践中认识客观或主观世界的成果,是人类从各个途径中获得的经过提升、总结与凝练的系统的认识。知识的获取(学习)涉及许多复杂的过程,如感觉、交流、推理。知识也可以看成构成人类智慧的最根本的因素,知识具有一致性、公允性,判断知识真伪要依靠逻辑,而不仅依靠立场。知识至今还没有一个统一而明确的界定,在不同的领域有不同的形式化描述。
人工智能学科和计算机科学中通常假设有一个形式化空间,空间中的元素称为数据,数据被认为是最基本的要素。数据的集合(或附加一些限定)称为概念,而知识被认为是概念之间的某种关系,这种关系的明确或隐含表达即为知识表示,而发现或导出这种关系的过程称为学习。
常见的知识表示方法包括以下五种。
● 经典逻辑表示法:如一阶谓词表示,其建立在形式逻辑之上,通过符号化表示数学中的某些逻辑论证,可以实现定理的自动证明等。
● 产生式表示法:它是人工智能领域应用最广泛的知识表示形式,其以规则作为形式单元,问题的求解过程可表示为一系列相对独立的操作,每个操作可由一条或多条规则表示,这种表示方法适合处理过程性的知识。
● 网络结构表示法:其用图模型来表示知识,可用来处理结构性的知识,典型的表示方法包括语义网络、Petri网、知识图谱等。
● 框架表示法:该方法利用框架结构来刻画事物各个方面的属性,形成有层次的知识体系,推理的过程主要是框架匹配和填槽。
● 脚本表示法:该方法利用一组槽描述事件发生的序列。在特定场景下,相应的脚本能够预见和解释即将发生的事件。
经典知识表示一般面向规范化的领域知识,而很少涉及非规范知识处理。早在2000年,陆汝钤院士向国家自然科学基金委申请就非规范知识处理进行立项研究,经过多年争取,终于在2004年11月,自然科学基金委下达国科金发计〔2004〕69号文件,正式批准国家自然科学基金重大项目“非规范知识处理的基本理论和核心技术”的计划任务书,项目批准号为60496320,资助研究经费为650万元。这是我国自主提出从非规范知识的数学理论、逻辑理论、认知理论、特定领域的非规范知识、互联网上非规范知识处理和非规范知识交叉领域等方面对非规范知识难题发起挑战,吸引了国内众多研究机构和高校的人工智能学者参与。该项目历时四年,取得了具有国际影响力的代表性成果,对我国在人工智能和知识工程领域的研究起到了极大的推动作用,对人才培养产生了深远的影响,许多参与的研究人员以本项目的成果为基础进行后续研究。
本章主要介绍陆汝钤院士提出并获得自然科学基金重大项目资助的“非规范知识处理的基本理论和核心技术”,接着介绍部分国内学者在不确定性知识表示与学习方面的工作,包括王熙照、陈德刚、吴伟志、徐卫华、李金海在这个领域内的研究成果。
不确定性知识表示与学习,按词义理解,即将不确定性融入知识表示和学习中(以便使这种表示更为精确合理)。不确定性是一个一般性概念,没有一个统一的形式化表达。不确定性有很多种类型,每种类型可有一个具体的形式化表达,分为主观不确定性和客观不确定性,也可分为数据的不确定性、模型的不确定性和学习过程的不确定性。常见的不确定性的表示形式和分析工具包括:随机性、模糊性、不可指定性、不纯度(分类熵)、粗集(上下近似)、粒计算、形式概念分析等。近十几年,不确定性知识表示与学习的研究有了迅猛的发展,并且在整个人工智能领域和相关产业界占有不可替代的位置。随着大数据时代的到来和深度学习的快速推广,表示学习已迅速成为业界和学术界十分关注的焦点。将不确定性建模后融入表示学习过程中,可更精确描述样本空间和假设空间,从而优化整个学习过程,大大提高学习的性能。