本体概念_论叙词表的概念属性对本体理论的渗透与转换

发布时间:2020-03-07 来源: 人生感悟 点击:

  摘要 论述叙词表的计算机化管理为转换领域本体创造条件,进行叙词表的概念属性转换本体的理论分析。通过本体转换原理、方法及建模过程的讨论,进一步指出叙词表本体转换的可行性和必要性。并借用农业科学叙词表转换为农业本体的实例来说明OWL语言的实用性及本体理论在信息资源组织过程中的影响与作用。
  关键词 叙词表 本体 OWL
  分类号 G254.24
  
  本体理论注重在知识组织结构的层面上描述具有语义关系的概念意义,其形成的本体技术(ontology)已经被应用于数字图书馆及相关领域,信息检索的规范化、智能化以及Web语义的分析和确定均可以通过Ontology来实施。叙词语言作为一种具有语义关系的语言系统,其词汇表达的某一领域的属性概念和On-tology有着相同的表现功能,通过叙词语言来建构本体理论中面向学科领域的概念化描述机制以及知识组织多元化体系具有显著的优越性。近几年来,国际科研机构和各国技术力量进行了广泛的研究,并取得了丰硕的成果,如联合国粮农组织利用RDFS(RDF Sche-ma)将Agrovoc叙词表转换为农业本体;美国Syracuse大学的J.Qin和S.Paling建立了把GEM(教育资料网关)中的受控词表转换为ontology的原理和原则框架。以叙词语言为基础建立的ontoloyg是有效可行的ontology enginneering的开发思路,叙词表所具有的概念集合和语义关联为本体技术的开发提供了丰富的资源。叙词表必须通过技术规范和方法指导逐渐向on-tology迁移,以达到ontoloyg中要求精确的类与类、类与实体之间的逻辑关系。
  
  1 叙词语言建构本体理论的原则和方法分析
  
  叙词语言的概念语义关系主要用“用”、“代”、“分”、“属”、“参”等表示,但是在使用过程中发现这些语义关系的逻辑划分界限并不十分严谨,如表示等级关系就包括多种:地壳运动和地壳平行运动(包含关系)、写字楼和写字间(整体和部分关系)、机械理论和电机原理(类和实例关系),这样,在逻辑关系的区别上存在着明显的混淆。本体技术的应用要求语义关系建立在严格的逻辑之上,对于叙词语言的本体转换需要根据叙词的不同情况采取不同的方法:①统一规则关系,如联合国粮农组织在转换Agrovoc叙词表时,将BT/NT关系统一为类与实例关系;②概念分解,如Per-ishable Product可以表示为带有Perishable属性的Prod-uct,Mother可以表示为带有Female属性的Parent。为了促进网络本体技术的发展,使得叙词语言更完备地转换为本体,国际信息与文献标准化委员会重新修订了叙词结构与使用技术标准(ISO5946),其中明确规定了转换方法:①用XML Schema构建叙词标记语言,建立叙词语言描述本体的基本框架;②用RDF Schema表示叙词内容,可以将叙词表中某一个概念范畴作为本体的某一领域的域值直接引入;③用DAML+OIL、OWL表示叙词关系,将本体理论描述引进深入。其中,OWL作为语义万维网的核心技术,意在提供一种语言,用于描述Web文档和应用中固有的类和类之间的关系。它通过定义类和类的属性来形式化一个领域,声明和定义对象与对象的属性以及在OWL形式化语义允许程度上对类和对象进行推理。
  OWL提供三种表达能力渐强的子语言,分别是OWLLite、OWL DL、OWL Full。OWL Lite支持的是那些需要一个分类体系和简单约束功能的用户。例如当OWL Lite支持集约束时,它只允许集的值为0或1。OWL DL支持的是想获得最大表达能力、具有完全计算能力及确定性的用户。OWL DL包括所有OWL语言的约束,如:类型区分(一个类不能同时是一个对象或者属性,一个属性不能同时是一个对象或者类)。OWL DL设计目的是支持现有的描述逻辑和为推理系统提供预期的计算属性。OWL Full支持的是想获得最大的表达能力但不确定是否需要计算性的用户。在OWL Full中,一个类能同时作为对象的集合,它本身也可以作为一个对象。OWL Full允许一个本体增加一个前控词表的意义。
  以上三种子语言,哪一种更适合应用本体的使用?具体来看,选择OWL Lite还是OWL DL,要根据用户对OWL所提供的需求程度来判断,OWL Lite的推理器具有令人满意的计算属性,而OWL DL推理器在遇到其他具有确定性的子语言时,将按最坏情况处理,服从复杂性更高的子语言;选择OWLDL还是OWL Full,主要根据用户对建模工具的需求程度来判断,两者相比,OWL Full对推理的支持比预期的相对较弱。
  
  2 叙词语言建构本体的模型理论分析
  
  2,1建模步骤
  本体建模理论主要以方法来表示,本体的建模方法有很多,其中Mariano Fernandez&GOMEZ-PEREZ等的METHONTOLOGY方法最为著名。METHONTOLO-GY是一种本体建模的结构性方法,其步骤为:
  2,1,1制定说明单的使用内容说明单的制定要详细、完备、一致,内容包括本体建模的目的、场景、用户确定、实现本体的结构化程度、范围及本体要表达的术语集、特性和力度。
  2,1,2获取信息的来源和方法信息来源途径很多,可以是各行业专家的思想、文献、数字、新闻等。获得信息的方法有逻辑思维法、访谈法、本文知识的分析与总结、知识检索工具的使用。
  2,1,3概念化过程将领域知识组织成概念模型,用说明单中识别的领域词汇表来描述问题和制定解决方案。生成的概念模型允许最终用户确定一个本体是否有用,并且对于某个给定的应用不需要查看源代码就可判断是否可用;比较多个本体的范围、完整性、可重用性和共享性。
  2,1,4实现过程
  用任何一种形式化的语言编码实现本体。需要一种开发环境的软件支持,包括:词法与语法分析器、翻译器、编辑器、浏览器、搜索器、评价器、自动维护工具。
  2,1,5评价过程
  对本体构建的每一个环节中本体本身、软件环境、文档状况进行评判,包括正确性、稳定性和有效性。
  2,1,6文档构成形成本体构建过程中的各个环节进行文档存贮。
  
   2,2建立词间关系自动转换系统
  由于叙词表所表达的词间关系过于宽泛,必须对其进行预处理和精炼。通过预处理和精炼,可以将叙词转换为本体中的概念,将词间关系精炼为明确的概念间关系。
  2,2,1要确定词间关系转换规则
  例如,在Agrovoc叙词表中,sheep RT mutton被定义为sheep(usedTo-Make>mutton,则可以规定If class x is sheep#1 andclass Y is mutton#1,and X RT Y then X Y。这样,叙词关系sheep RT mutton自动转换为概念关系sheepmutton。
  2,2,2改正有问题的词间关系并转换为正确的概念关系主要算法是:
  
  
  2,2,3检查词间关系转换的结果,对不合理的词间关系进行修改可以通过三种方式进行检查:
  ?概念检查:查询概念,返回概念间的关系,检查是否正确,如检索“sheep”。
  ?概念间关系查询:如。
  ?规则查询,如Ⅱx and Y are marked as“T*”inthe concept type field,and X BT Y,then XY。
  
  2,3本体的OWL输出表示
  我们可以把METHONTOLOGY方法看成是对叙词表的精炼过程,通过建模实现了叙词表词汇上的丰富和语义关系上的逻辑表达。在此方法下,通过软件工具Prot6g62000,利用OWL语言来整体建模,模型文档片段如下所示:
  
  对于建模的评价应该是查看建模文档的合理程度及运行稳定状态,从中体现出本体概念、属性及语义关系的明确性和准确性,将结果返回到建模步骤2.1.4中,进行修改,经反复修改后最终确定该领域的本体模型框架和内容。在建构本体的过程中,利用叙词表进行本体建构具有客观的优势,叙词表本身被称为轻量级本体,其所包含的概念层次清晰、逻辑性强,对各个学科专业词汇收录得比较完备,在叙词表的基础上构建本体可以起到事半功倍的效果。尤其对于一些专业叙词表,其构建本体的效果更好。
  
  3 农业科学叙词表向农业本体转换实例分析
  
  3,1农业科学叙词表的OWL描述
  对于W3C推荐的本体描述语言OWL有着更为强大的表达能力,是在Web上发布和共享本体语义标记语言,OWL有三种子语言:OWL Lite、OWL DL和OWLFull。农业科学叙词表转换为本体将以OWL语言格式进行保存。我们通过农业科学叙词表中的一个例子来说明向本体转换的情况,下面为“剑桥学派”的部分叙词及词间关系:
  
  
  以上为较为简单的OWL表达的叙词表中叙词间的语义关系,若要更为精确地表达,还要建立更多属性来描述细分后的语义关系,这里就不再说明了。
  
  3,2农业科学叙词表转换本体系统的设计与实施
  农业科学叙词表本身是一个叙词数量庞大、结构复杂的语言体系。随着计算机技术的发展,目前已经研制出电子版的农业科学叙词表,我们就以Visual Stu-dio,net 2005应用软件为平台,构建本体批量转换系统。其系统转换功能包括以下三个方面:
  通过系统界面层CAT_To_OWL的显示,转换系统的操作主界面如图1所示:
  主界面中“核心转化”模块为主模块,该模块可以选择需转换的叙词的一级类目,可选择多个,并能够暂停或终止转换操作,状态区显示转换的进度,如图2所示:
  核心转换过程中,系统根据所选定的一级类目,查找出所有的叙词,将所有叙词进行“类”的定义,并将和这些叙词具有等同、等级和相关关系的叙词查找出,最后根据不同的关系类型进行OW1的转换,如图3所示:
  以上是对农业科学叙词表转换为本体的功能操作。另外,系统的参数配置及转换结果的比较和评判也是重要的功能部分。通过农业科学叙词表的丰富素材及相关专家的预处理,才逐步形成了转换后的相关“类”的语义关系,继而形成了农业领域本体完整的结构与充实的内容,为农业信息资源的组织与管理奠定了坚实的基础。

相关热词搜索:词表 本体 渗透 论叙词表的概念属性对本体理论的渗透与转换 叙词表转换为本体的研究 从叙词表到本体的转化研究

版权所有 蒲公英文摘 www.zhaoqt.net