
1.4 大数据知识工程的应用场景
大数据知识工程面向国民经济的主战场,具有十分广阔的潜在应用价值。从工业到农业,从天文到地理,从预测预报到决策支持,随着大数据深入的领域越来越广,大数据知识工程发挥着越来越重要的作用。下面我们分析几个大数据知识工程的应用场景。
1.4.1 大数据知识工程在电子商务领域的应用
基于大数据知识工程的电子商务是大数据知识工程应用的一个典型场景,它将异构的大数据源建模方法同电子商务理论相结合,以知识工程的思想来实现涉及多个交叉的知识领域和多领域推理的大知识服务系统。大数据知识工程管理下的电子商务发展具有数据化运营发展模式和行业应用垂直整合两大新特征,对大数据的有效传递和共享,能够通过供应链的协调来实现。丰富多样的数据对用户行为进行全面的记录,从而为用户提供精准的广告和商品推荐内容,这些都为人们的生活提供了更便捷的服务。
1.4.2 大数据知识工程在教育领域的应用
在教育领域,大数据知识工程也大有可为。基于个性化推荐服务的大数据知识,通过来自各方面的教育信息,构建大型的个性化教育知识图谱。例如,某位计算机专业的应届毕业生希望获得一份上海的软件开发岗位的工作,该毕业生已具备高等数学、数据库、数据结构等基础知识,但为了匹配该岗位的应聘需求,还需要高级编程语言的技能。通过求职岗位的知识图谱与毕业生个人专业技能的知识图谱的对比映射,可以发现相似的图模式及模糊匹配过程中缺失的节点,从而找到该毕业生求职的提升路径。类似地,这一应用可以推广到就业培训等领域。例如,由于人文和气候的地域差异,北方具有老牌的工业传统,而南方的小市场经济发达,网上的就业培训系统需要根据用户的地理信息进行个性化的知识筛选,结合用户的个人就业倾向和现有岗位在地域的需求情况,进行就业培训内容的推荐,方便用户就近选择与个人相匹配的工作岗位,并迅速定位所欠缺的职业技能,从而针对性地进行补缺补漏。这一筛选过程是通过知识库中的大型知识图谱和用户个人的知识图谱在一定约束条件(如地域)下进行匹配而实现的。
1.4.3 大数据知识工程在医学领域的应用
大数据知识工程在医学领域也有广阔的应用前景。普适医疗是面向具有多源性、海量性、动态性、异构性、不确定性和实时性等特征的医疗健康数据,通过数据挖掘及其他协同的人工智能技术,提供多源医疗信息自动聚合、知识发现等服务的医疗服务推荐机制。为了提升普适医疗应用的适用性,需要对医疗数据进行合理的管理,使其有统一化的表示形式。由于医疗数据在不同地区、不同医院、不同等级的医疗器械上的记录标准不同,甚至存在错误的记录,所以在进行医疗数据融合时,需要采用具有一定容错性的模型,通过与个人电子病历的比对,提供智能化的医疗方案,包括治疗效果、疼痛程度、过敏记录等知识的引入,都有助于建立完善的知识图谱并提升个性化查询结果的精确度。为了提升用户交互体验,需要结合医疗服务大数据的特点,选取适用于交互式统计分析的技术组合,HDFS和HBase可以为医疗大数据和社会计算结果提供良好的存储服务,Spark平台可以提供交互式、高效的并行计算服务,这与BigKE是相符合的。
1.4.4 大数据知识工程在决策领域的应用
大数据知识工程对决策领域的影响涉及多个角度,包括工艺决策、政府决策、智慧城市的决策等。其中,工艺决策由于工艺过程涉及加工方法选择、制造资源选择等,需要对集成的知识进行建模与决策。大数据知识工程在知识表达、获取和使用的基础上,融入了大数据的计算和推理平台,可以充分支持工艺决策的多个问题的智能处理要求。而大数据知识工程对政府决策的变革体现在事前预测、事中感知、事后反馈和调整三个方面。基于大数据知识工程的处理框架,利用知识推理方法预先给出决策选择,并根据决策反馈及时调整工程模型,为政府决策提供了新的突破方向。面向智慧城市及城市重大事件管理的实际需求,大数据知识工程还可以针对城市大数据在自然属性、地理属性、时间属性、社会属性及交互行为等方面的异构、自治、多介、高维、低质等特点,发现在时空维度推进下蕴含的内在关联语义的一致性。这样的决策机制具有动态适应性,能够更好地发现城市管理事物之间的相互作用、渗透和扩散的物理模型,为城市行为涌现、传播和演化机制提供更好的预测方向。
1.4.5 大数据知识工程在华谱系统的应用
华谱系统是非商业化的、面向所有华人姓氏的家谱系统。华谱系统是国家重点研发计划“云计算与大数据”重点专项项目“大数据知识工程及其应用研究”的示范应用之一。通过大数据挖掘和大数据知识工程技术,对异构、冗余、关联复杂的家谱数据进行大知识的挖掘和推理服务,分析姓氏之间的关联及姓氏的起源、变迁等过程,旨在解决用户传承、寻根、溯源等问题。对家谱大数据的研究和推理是大数据知识工程应用的新方向,它在提供隐私保护的前提下,赋予用户多样化的权限管理及隐私信息输入、整理和检索功能,通过数据融合和协同过滤的手段,以分布式的数据存储快速响应,并给出合理的姓氏推理结果。