工业自动化仪表领域本体的构建研究:领域本体构建
发布时间:2020-03-07 来源: 美文摘抄 点击:
摘要 介绍本体构建的意义,指出创建本体库是实现智能检索的关键,通过简单综述国内外本体构建的现状,指出我国本体构建的不足,并总结现有的本体构建原则和本体构建方法。在此基础上,提出工业自动化仪表领域本体构建的方法,并重点详述工业自动化仪表领域本体构建的流程,阐明其先进性和易操作性,最后指出此构建方法和流程可以推广应用于其他领域。
关键词 仪表 本体 领域本体 构建方法 OWL
分类号 TP31
1 引言
大量研究表明,创建本体库是实现智能检索的关键,具体表现在:
?语义理解的基础。通过创建本体库,为系统提供了规范化的领域概念模型,这种形式化的模式给出了概念及概念间关系的明确定义,建立了人机对系统信息的共同认识,为智能检索提供了语义理解基础。
?概念匹配的检索机制。由本体所提供的领域知识体系提高了用户需求理解和资源描述的准确度,将传统的检索机制由关键字匹配转变为概念和内容的匹配,从而提高了信息检索系统的检索效率。
?知识表示、共享和重用。本体知识体系的表示是“机器可处理”的语义,它以RDF为基础,以XML为语法,将不同的应用集成在一起,对Web上的数据进行抽象表示,允许跨越不同应用程序、企业和团体进行知识的共享、重用和获取。
然而,目前可供借鉴的、完善的本体库很少,这种现象在我国尤为突出。为此,本文构建了工业自动化仪表领域本体库。一方面,它为项目组数据共享系统实现智能检索奠定了基础;另一方面,它使知识在系统中规范化地表示出来,有利于相关领域实现知识复用。
目前,国内外开发了许多智能化搜索引擎系统,如国外的大学的STASIS、ProNet、ImportNET项目、浙江大学吴朝晖教授开发的中医药本体在线编辑和维护方BFO、COSMO、PRO、SWEET等以及我国清华法以及人工智能研究所基于本体论的产品配置研究,此外,还有中国农业科学院科技文献信息中心的AOS(AgricultureOntologyService)等项目。领域本体库的构建为这些项目的顺利实施提供了保障。目前,国外已经建立了许多知名的本体库,如ontoselect、DMOZ、DAML等,部分知名的本体库和网址如表1所示:
然而,在我国,本体研究整体上处于起步和摸索阶段,完善的、规模较大的本体库并不多,本体构建一般仍采用手工方式,这在一定程度上影响了我国本体库建没的规模和本体库的实际应用,进而阻碍了我国智能化搜索引擎的研究进程。
2 工业自动化仪表领域本体的构建方法
Gruber在1995年提出的本体构建5原则影响最大。尽管10多年过去了,但目前构建本体通常仍遵循这5条原则,即:明确性和客观性、完整性、一致性、最大单向可扩展性、最少约束。常见的本体构建方法有:Enterprise法、TOVE法和七步法等。其中,斯坦福大学的七步法成熟度最高,目前国内外很多领域在构建本体库时大多采用这种方法。
然而,无论是本体构建原则还是本体构建方法都应该灵活变通。除了遵循“Gruber 5原则”以外,一个优良的本体模型还应该是“有用”的,即在面向特定的应用时,所需的领域本体最终能应用于实践。另外,随着相关技术的发展,本体构建方法也应该在一定程度上加以改进。为此,我们结合国内外现有的技术基础,对斯坦福大学的七步法进行了修改,形成了“工业自动化仪表领域本体构建七步法”(以下简称“IAIOnto七步法”),如图1所示:
如图1所示,构建领域本体库首先需确定其领域和范畴,接着收集并整理大量基础资料,然后,确定领域概念的类体系结构和关系、属性以及实例,通过编程将其批量导入到本体结构中,接着在本体编辑工具中对本体结构进行修改和完善,最后对领域小体库进行更新和维护,如果发现新的概念、关系等再重复以上步骤。其中第3、4、5步是通过编程实现的,具体为调用Jena API,并通过编程将相关概念等导入本体结构,最后存储为owl文件。鉴于Prot6g6是一个免费的、功能强大的、开源的本体构建软件,所以第6步中,项目组选择Protege对编程构建的本体结构进行更加直观的修改和完善。IAIOnto构建方法通过编程实现了大规模领域本体库的构建,更新维护更加方便、易操作,且可以推广应用于其他领域。
3 工业自动化仪表领域本体构建流程
3.1 确定本体的专业领域和范畴
构建IAIOnto是国际科技合作项目“基于知识管理的数据共享关键技术研究”的重要内容之一,该项目依托于国家科技基础条件平台项目“先进制造与自动化科学数据共享网”。该项目组拥有大量仪器仪表领域数据和多位仪表领域权威专家,因此,将仪器仪表领域作为本体构建的专业领域;另外,由于“共享网”侧重于机械和自动化,并且仪表领域中的工业自动化仪表资源最为丰富和成熟,因此,首先确定以工业自动化仪表为范畴构建仪表领域本体,最终归纳一会建立领域本体的模式和方法,在“共享网”的其他专业领域进行推广和应用。
3.2 搜集基础材料,对材料整理加工
本体是共享概念模型的形式化规范说明。其共享性、规范性等要求其概念必须被大众所接受,并囊括该领域所有基本概念。因此,需要收集大量该领域的基础资料,使本体概念的选择等有据可依。有鉴于此,项目组从五个方面收集资料,如图2所示:
?《仪器仪表主题词表》:共包括18个领域范畴、4481个主题词,选取其中最相关的仪表元件、仪表材料、工业自动化仪表等作为本体类层次结构的主体;
?《中国图书馆分类法》:其中工业技术中的仪器仪表相关概念是本体构建过程中概念参考的重要信息,如声学仪器、真空测试及仪器、矿山测量仪器与工具等大类及下位类;
?产品规格数据库:共包括1万多种仪表产品,是本体属性集、标准实例集和仪表实例集自动提取的主要数据来源;
?厂商数据库:共包括4000多家仪表领域知名企业,是本体厂商实例集自动提取的主要数据来源;
?仪表网:是本体实例集等数据提取的重要来源,其中仪表数据的元数据信息是属性的重要参考。
3.3 确定类体系结构以及类之间的关系
构建具有一定规模的本体是一个系统工程,每一个概念、关系或规则的添加都必须严格谨慎,应该基于一定的理论基础并遵循一定的领域知识。另外,还需要考虑所添加概念、关系、规则等的有用性以及系统的可行性。
根据需要增添仪表厂商、标准规范等顶层类,最终形成5个顶层类的体系结构。邀请仪器仪表领域专家,参照《仪器仪表主题词表》和专业词典,进行概念的抽提、去重、语义分析和归并,并参照中图法中的概念对现有体系结构进行必要调整,调用Jena API将类层次结构导入本体,形成一个庞大的IAIOnto体系结构。结合本体概念之间固有的联系、本体的用途等建 立类概念之间的关系,如图3、图4所示:
3.4 添加属性
类和关系只是描述了一个领域的体系框架,还不能确切地、真实地描述一个领域,需要继续定义领域的内部结构,即添加领域本体概念的属性。同时,在定义属性时应该将其放在最概括的类里,通过类与子类之间的继承关系作用于下级类。
?属性的选择应该考虑本体的用途、属性的有用性和信息的获取难度等因素。如,工业自动化仪表的属性:
生产厂商――>仪表厂商
相关仪表元件――>仪表元件
相关仪表材料――>仪表材料
相关标准――>标准规范
用途――>测量对象或使用场合(用途)
?添加属性还应该参照元数据信息。以玻璃温度计为例,如图5所示:
由此可以确定玻璃温度计的属性包括产品型号、主要用途、生产单位等信息。
?对所有的属性进行整理。对仪表技术规格和厂商信息等语料资源进行分析判断,提取出一般仪表均具有的较为通用的属性,并将常用的属性进行归纳整理。尽量将拥有一定规律的“DataTypeProperty”转化为“ObjectProperty”,并增加了辅助概念顶层类,调用Jena API,将整理后的属性通过编程导入本体,并建立类的属性。
需要注意的是当为实例添加属性时,属性的量随着实例的增加而增加,因此,应该对属性进行适当地处理。尽量将拥有一定规律的“DataTypeProperty”转化为“ObjectProperty”,增加辅助概念顶层类。如玻璃温度计的主要性能指标属性中有一个测量范围的属性值是“-80℃~500℃”。对于这样的取值范围,在属性中是无法直接表示成数值型的。为此,我们将性能指标“DataTypeProperty”转换为“ObjeetProperty”,增加了“范围”和“单位”两个顶层类,从而解决了这个问题,即,为“范围”赋予最大值和最小值两个属性,这样仪表就可以添加范围的属性,从而实现数值范围属性的表示方法,如图6所示:
3.5 添加实例
《产品规格数据库》、《厂商数据库》以及仪表网中含有大量的数据,这些数据是IAIOnto实例的重要来源。在以往的本体构建过程中,一般都是采用手工方式将实例添加到各个对应的类中。然而,当处理大量实例数据时,这种手工添加的方式就暴露了一定的弊端,成为本体构建和维护的瓶颈。
针对这一点,调用Jena API自动地将仪表、厂商、标准等实例添加到相应的类中,并添加各实例的属性及实例之间的联系。
3.6 形成owl文件,在prot6g6中验证和完善
通过以上几个步骤完成了IAIOnto构建的程序设计。接下来,我们选用由W3C工作组于2004年正式推荐的OWL本体描述语言,将通过编程编辑好的本体体系结构导出,并存储为owl文件。
目前本体构建工具已经非常成熟,出现了一些辅助创建本体的工具和系统,如jena、pellet、racer以及GALEN项目开发的ONIONS系统和DODDLE等。构建本体应该充分利用这些现有工具,最大限度地挖掘其各项功能。项目组通过比较选择通用性和扩展性很好的prot6g6作为本体编辑工具,将程序存储的owl文件导人到prot6g6程序中进行修改和完善,类的部分结构树形图,如图7所示。
IAIOnto的TGviz关系图如图8所示。
IAIOnto有很好的可扩展性和权威性,但通过编程自动建立的本体,不可避免地存在一些问题,需要构建人员在prot6g6中进一步修改和完善。同时,邀请仪器仪表领域专家进行咨询和指导,对本体进行评价。评价内容包括类、属性以及类之间关系的完整性和准确性等方面的内容。根据专家提出的指导意见和自检发现的问题对本体进行反复修改,直至最后形成完善的IAIOnto原型。
3.7 本体的更新和维护
目前,已构建的领域本体共包括1071个类概念,1600多个本体实例(主要为温度仪表领域的产品、标准和厂商等)以及100多个属性。随着项目的不断深入以及人们对领域认识的提升和新知识的不断涌现,本体的更新和维护将成为非常重要的工作。对本体进行更新和维护可以参照许多本体构建方法,如METH-ONTOLOGY法和TOVE法等。同时,本体的维护恰恰又能体现本体的优势,对数据库维护来说,信息需求的变化往往导致数据库模式的变化,而本体因为其知识表示的灵活性,不需要做底层数据结构的改变。然而,值得一提的是,本体的维护是一项长期的、繁重的工作,这项工作需要许多人长期的、不懈的努力。
4 总结与展望
构建IAlonto只是一个开端,构建它的目的是为了利用它强大的信息聚合特性和推理机制,构造出真正的知识库,解决智能检索中的许多关键问题。目前无法做到完全自动地构建领域本体,仍需要人工干预,相信今后将会有大批高质量的国外以及中国本土的研究成果出现。笔者认为,尽管我们目前所做的工作影响并不是很深远,但是,前沿的学术研究和实践成果正是由许许多多看似没有意义的工作铺垫出来的。同时,我们也应该看到,我国在描述逻辑、查询、规则以及数据库和本体的结合这些问题上的研究和国外的距离还相差很远,所以,只有在这些方面的研究有所突破,才能在国际上占有一席之地,否则,很难挤进制定标准和引领技术进步的圈子里去。
相关热词搜索:本体 构建 领域 工业自动化仪表领域本体的构建研究 智能化的主要研究领域 自动化领域
热点文章阅读