【近五年国内基于本体的数字图书馆研究综述】近五年工作综述
发布时间:2020-03-10 来源: 人生感悟 点击:
[摘要]以2005年到2009年中国大陆基于本体的数字图书馆研究的文献为分析对象,概括近五年来我国学者围绕本体与数字图书馆的理论研究重点,并从本体的理论研究、本体的构建、本体的映射等方面简要回顾此时期我国在这一研究领域的进展与研究特点,总结出国内研究的不足之处,并对未来发展趋势进行分析。
[关键词]本体 数字图书馆 综述
[分类号]G250.76
近几年,我国图书情报界开始致力于研究本体在数字图书馆领域的应用,以寻求数字图书馆在资源的高效组织、利用与共享等方面的新突破。本文利用清华同方cnki数据库、维普数据库和万方数据库作为检索工具,查找出其中收集的2005―2009年五年里国内发表的基于本体的数字图书馆研究的文献。通过对这些文献的分析,试图描述出近五年来国内学界在本体领域的研究进展,分析其特点与发展趋势。
1 国内基于本体的数字图书馆的研究内容重点剖析
笔者以2005年到2009年为检索时限,采用检索式“篇名‘本体’篇名‘数字图书馆’”以及检索式“篇名‘图书馆’关键词‘本体”’在清华同方enki数据库、维普数据库和万方数据库中分别进行精确检索,检索结果经汇总和去重,最终获得基于本体的数字图书馆研究的期刊论文117篇,其中90余篇文章的研究主题主要集中于:论述数字图书馆中本体的理论研究、本体在数字图书馆信息检索中的应用、数字图书馆中基于本体的资源组织和整合、本体在数字图书馆个性化服务中的应用、数字图书馆中本体的构建以及本体映射等。具体而言,2005年以来,国内基于本体的数字图书馆研究主要集中在以下六个方面:
1.1 本体的理论研究
国内对本体的研究最初始于对本体的理论研究,目前,国内学者对本体的概念已经达成共识,均采用Borst提出的概念,即“本体是共享概念的形式化规范说明”。此次调研的论文中,很多学者对本体与分类法、元数据的关系及其对数字图书馆的影响等方面进行了研究。
1.1.1 本体与分类法、叙词表和元数据的关系 由于Ontology是研究概念及概念间关系的,与图书馆学情报学中的规范化词表有着许多的相似之处,因此引起国内图书馆学情报学研究者的极大兴趣。关于Ontolo一gy与传统的分类法与叙词表及元数据之间的区别与联系的研究成为众多研究人员共同关注的论题。
学者们认为:分类法与叙词表均采用规范的语言,具备一定的标准体例,结构稳定,相对保守,不易修改,可以表达简单的语义关系;而本体中的概念采用自然语言或半自然语言来表达,是一个开放集成的体系,可以随时修订、更新和重用,描述的语义关系更为深入、广泛。元数据和本体的共同之处是:采用标准编码语言进行形式化处理,因而能为资源提供语义基础,可用于资源组织和资源发现。其差异表现为:元数据难以对不同知识体系、不同粒度的资源进行描述,而本体则提供了不同元数据之间的相互映射机制,可实现异构系统之间的互操作。
1.1.2 本体对数字图书馆的影响 本体在图书情报领域的很多方面都有应用,例如文献标引、知识管理、知识库构建、图书馆信息资源构建等等。尤其在数字图书馆研究和建设中,本体发挥着重要作用,本体正被应用于其中的各个方面,例如信息组织、信息检索和异构信息系统的互操作等。学者们认为,随着图书情报学理论及信息技术的发展,各个学科领域将会出现各自的特有本体,这也将给传统的信息组织和信息利用带来一次根本的变革。
1.2 基于本体的信息检索技术研究
概括地讲,本体在信息检索中能够较好地改进信息检索系统性能,表现在:①具有集成结构化文档、半结构化文档和关系数据库的知识,提供机器能够理解的语义知识。②支持术语的语义推理,分析用户提问中所包含术语的意义,理解用户的问题。③通过概念间的关系来表示概念语义,从而能够提高检索的查全率和查准率。④在检索过程中和检索结果显示时可为用户提供语义提示,更好地实现与用户的交互。
在此次调研的文献中,有18篇文献是研究本体在图书馆信息检索中的应用,由此可见,基于本体的检索是数字图书馆研究的一大热点,通过调研发现,国内对本体在信息检索中的应用主要体现在以下几个方面:研究基于本体的数字图书馆个性化知识检索的问题,构建基于本体的个性化知识检索模型;研究数字图书馆中智能检索实验系统的构建问题,通过在基于本体的数字图书信息检索模型中提出关联检索,并利用贝叶斯网络给出解决方案;研究基于本体的图像检索方法,并构建图像本体;从体系结构、语义提取等方面对基于本体的数字图书馆检索模型进行了详细的研究。
1.3 基于本体的个性化服务研究
个性化信息服务的关键是能够为用户提供有针对性的资源。本次调研的文献表明,将本体应用在用户服务中,不仅能提供个性化服务,还能提高服务的效率和质量。为了能够向用户提供个性化的信息服务,基于本体的数字图书馆个性化信息服务系统必须为每个用户建立一个用户描述文件来描述用户的兴趣特征,用户兴趣的收集可以在用户注册自己的兴趣和爱好的基础上再通过分析用户的检索请求及跟踪用户行为和对用户的日志挖掘来获得用户兴趣特征,从而对用户兴趣建模,并且系统对用户的兴趣模型能够不断更新:鲍翠梅引入本体对信息资源和用户兴趣特征进行描述,提出了在语义层次上实现数字图书馆个性化信息服务的系统框架模型。陈燕、孔季在构建用户兴趣本体的基础上,结合语义网格中的关键理论和技术,构建了四层体系架构的智能化数字图书馆新书通报推送服务系统模型以及系统实现的整个流程。由于可以通过构建本体的方式对异构数据建立语义关系,因此该系统可以更加灵活、准确地对本体间的概念进行相似度计算和过滤,得到与用户兴趣需求利用本体完成智能化的新书通报匹配,将相匹配的新书通报结果推送给用户。
通过调研发现,目前数字图书馆中基于本体的个性化服务研究前沿集中在用户情景敏感建模。用户情景敏感的数字图书馆服务是根据用户特定信息活动情景自动揭示、推荐可使用资源和服务的一种数字图书馆个性化服务,充分考虑了用户身份、行为、关注对象及偏好等。用户情景建模是指对用户情景信息及其特定情景的信息活动信息进行可计算的描述。李书宁利用OWL对用户情景敏感服务所要描述的个人信息情景、信息行为情景、处理资源情景、时间历史情景和接受服务情景这五大类情景进行本体建模,并对情景模型的初建和更新进行了探讨。
1.4 本体的构建研究
对本体的研究不应该仅仅局限在理论模型方面,更重要的是应该进行实际操作――构建本体,并将其应用到数字图书馆中。目前,国内学者构建本体的方法主要有两种:
1.4.1 采用完全手工的方法构建本体 即在领域专 家的帮助下用本体描述语言将本体描述出来。实际上所谓的手工创建本体,并不是完全依靠手工创建,而是通过本体编辑工具来辅助实现。调研显示,国内已经有许多学者利用本体语言和编辑工具,结合自己研究领域的实际情况,构建领域本体。如彭蕾基于本体OWL语言,采用Protge开发工具,以石棉制品特色库为例,构建了一个本体模型应用实例。欧阳宁、包平利用本体构建工具Protege进行了《中国图书馆分类法》部分类目的可视化实践。牟冬梅以医学领域的预防医学为例,研究语义网格环境下数字图书馆领域本体的构建与应用。
1.4.2 采用自动化的或半自动化的方法构建本体即从词典或结构化、半结构化的数据或文本中抽取或学习或发现领域本体。根据本体学习的知识源的不同。对于采用自动化或半自动化的方法构建领域本体的方法进行分类:从词典进行本体学习,将构建本体建立在已有的机器可读的词典的基础上,从中抽取相关的概念和概念间的关系;从知识库中进行学习,通过从已有知识库中学习来构建本体;从关系数据库中抽取本体;从半结构化的数据学习;从文本中学习等。如刘柏嵩提出一种面向数字图书馆的本体自动构建方法,包括术语选择、抽取本体概念、语义关系抽取、分类体系构建、本体构建和本体修剪及评价。自动提取领域本体的基本流程可概括为:①从知识源中提取有代表性的概念,形成领域本体中的概念;②通过分析概念的属性和聚类中元素与其他元素的关系提取本体中的概念关系;③解决概念间关系的冲突。
1.5 基于本体的信息资源组织和整合研究
信息资源整合是实现数字图书馆建设目标的关键,而信息资源的整合涉及诸多快速发展的新技术和新方法,本体就是这些新方法之一。数字图书馆信息资源包括许多层次,如文本文献信息资源、多媒体信息资源及知识管理仓库等。基于此,目前基于本体的数字图书馆信息资源构建是一个多层次的体系,从宏观上包括三个层次结构,即基于本体的文献信息资源构建、Web信息资源构建及知识管理中知识库的构建等。如张敏勤讨论了基于本体的数宇图书馆信息资源构建可操作的方法体系。王军探讨了基于XML本体语言描述的数字图书馆Web信息资源整合系统的功能及其实现途径。
此外,利用本体可以对信息资源进行动态组织,在检索系统中,将文献的标识与用户的提问进行有效地对接,即以用户提问为基础构造提问模型,并基于检索结果构造标识模型,将提问模型与标识模型在语义层面通过领域本体进行映射,从而实现文献标识与用户提问在语义层面的互通,最终以用户提问的语义方式来展现检索结果。
1.6 本体的映射研究
现在本体的应用越来越多,但由于语义网的分布式特点,造成了大量本体间的异构性,这种存在于不同信息源本体之间的异构现象,成为系统相互理解、信息交换、实现互操作的主要障碍之一。要想完成信息交流的任务就必须在本体之间架起语义映射的桥梁。本体映射能很好地解决本体异构问题。它是发现两个相同领域本体的概念之间的相关性(映射关系)的过程,同时本体映射也是本体集成、本体合并、本体修正、本体翻译的技术基础。为解决异构本体间映射问题,国内研究人员已经提出了不少的映射方法和映射技术,如毕强、韩毅基于语义网格技术,探索基于元数据本体的数字图书馆系统间的互操作策略,提出下一代数字图书馆系统间互操作框架――基于元数据本体的DL互操作框架。刘成山、赵捧未给出了对等网环境下数字图书馆的一种本体映射算法,从语法、词汇和语境三个方面进行概念的匹配,重点提出了语境用于相似度计算,并通过仿真实验表明系统的构建和映射算法是有效的。
2 国内基于本体的数字图书馆研究的特点与不足
在此次调研过程中,笔者发现国内有关此主题的研究体现出一定的特点,也存在需要完善的地方:
2.1 国?基于本体的数字图书馆研究的特点
2.1.1 数量增长迅速,核心作者群初步形成 如前文分析,虽然国内基于本体的数字图书馆研究逐年升温,而且研究论文数量增长迅速。同时出现了如董慧等带领的团队对本体的跟踪研究,核心作者群已经初步形成,核心作者群的存在与否以及核心作者数量的多寡在一定程度上可以反映出一个研究主题的成熟程度。可见,目前国内多数学者对这一研究主题的研究正在升温。
2.1.2 研究内容逐渐与具体应用靠拢 从目前的研究特点分析,国内围绕本体与数字图书馆的研究已经逐渐从理论性介绍发展到本体在数字图书馆的各种实际应用。在研究初期,经常会出现诸如本体对数字图书馆的影响等这样内容的一些文献,而随着学者对本体研究的不断深入,从资源组织、信息检索、个性化服务、映射技术等更加细化的研究角度开展此主题的研究正在成为主流。
2.2 国?基于本体的数字图书馆研究的不足
虽然本体在人工智能、知识表示中已经被广泛地讨论和实践,但在我国图书馆情报界及数字图书馆研究领域中的研究仅仅局限在概念的界定和初步的理论研究层面上,对于本体的方法论、描述语言、构建工具、具体构建缺乏实践。从此次调研的结果分析,尽管文章的数量反映了国内学界或业界对基于本体的数字图书馆研究较为热烈,但多数文章仅仅是从理论上加以探讨,构建本体和其应用系统开展的研究不多。有许多文献只是简单提出了基于本体的一些模型或者机制,缺乏对本体实际应用的深刻理解。仅有少数的几篇文献真正在实践中构建了本体,并应用到数字图书馆中,事实上,正是这样的研究才真正有利于推动国内数字图书馆在建设上更好地引进本体、应用本体。
3 国内基于本体的数字图书馆研究未来发展趋势
根据上述所分析的国内基于本体的数字图书馆研究的不足之处,加之对国外近年来关于本体的研究成果分析,笔者认为,未来国内基于本体的数字图书馆研究可能有以下几个方面的趋势:
利用本体技术实现深层次的个性化服务。目前国内对基于本体的个性化服务集中在用户建模、个性化推荐系统等方面,未来研究点有:如何在用户本体中精确地体现用户兴趣衰减问题、如何进一步完善个性化推荐规则、如何综合应用各种推荐技术的个性化本体学习资源推荐策略,即基于内容的推荐技术和协同过滤技术有效整合,从而实现在不同的情境下采用不同的推荐技术。用户情景敏感的数字图书馆服务涉及用户情景的获取、情景建模描述、情景推理、情景服务等多个方面。目前国内研究只是对其中用户情景建模进行了初步的探讨,用户情景建模的结果实际上就是构建一个用户情景敏感数字图书馆服务用户情景本体,本体的具体构建需要在现有情景要素的基础上继续细化,深入把握情景要素之间的关系,情景获取算法和推理算法也是需要未来深入展开研究。
研发本体的自动化构建方法。在本体构建方面,目前国内存在的绝大多数本体都是手工生成的,即 在领域专家的帮助下用本体描述语言将本体描述出来,并通过本体编辑工具来辅助实现,该方法费时费力,还容易出错,更难维护和更新。由于数字图书馆中信息量巨大、主题繁多,研究如何自动化、半自动化生成本体具有重大的意义。如何确立本体动态构建机制,如何进行本体的自动化构建、更新,如何利用本体理论和与语义网技术设计更加有效的本体构建算法将成为未来本体构建的研究趋势。
开发本体的自动化映射。本体映射已经是语义网发展过程中存在的一个重要问题,国外在这方面的研究已经取得了不少的成果,如大规模本体映射方法研究、快速映射模型研究等,而国内这方面的研究相对还较少。目前几乎所有的算法案例中采用的都是专家人工输入,不同本体映射的半自动化和自动化的研究取得的成就十分有限,这是今后该领域研究王作的一个重点。
4 结 语
国内外学界和业界对本体的研究与实践不仅拓展了本体在数字图书馆的应用空间,同时也提升了数字图书馆在资源组织、服务个性化等方面的能力。通过调研发现,本体研究已经是国内数字图书馆研究的核心部分,近五年来国内基于本体的数字图书馆研究主要集中在个人化服务、信息检索技术、本体的构建、信息资源组织与整合、本体的映射等几个方面。未来,如何利用本体提供深层次个性化服务、如何自动化构建本体、如何开发本体映射方法等将是从事此研究主题的学者专家探讨的热点。
参考文献:
[1]严青,ontology及其在图书馆情报领域中应用之综述。黑龙江
科技信息,2008(35);18l-182
[2]乔燕鸿,国内图书馆学情报学领域关于Ontology的研究综述,
现代情报,2006(9):121-124
[3]彭骏,陆敏,杨发毅,基于本体的数字图书馆个性化知识检索研
究,情报理论与实践,2009(5):78―80
[4]谢圣献数字图书馆中关联检索研究,情报杂志,2008(1):126-127
[5]贾保先,谢圣献,解方文,等,数字图书馆中基于本体的图像检
索,情报杂志,2008(7):2―24
[6]董慧,杨宁,余传明,等基于本体的数字图书馆检索模型研究
(I)――体系结构解析,情报学报,2006(3):16-18
[7]董慧,余传明,杨宁,等,基于本体的数字图书馆检索模型研究(Ⅲ)――历史领域资源本体构建,情报学报,2006(5):18―20
[8]鲍翠梅,基于本体的数字图书馆个性化信息服务研究,现代情报,2009(5):77―79,84
[9]陈燕,几季基于语义网格的数字图书馆新书通告推送服务系统研究,图书馆学研~,2009(8):38―41
[10]李书宁情景敏感数字图书馆服务系统用户情景的本体建模。 情报资料工作,2008(6):61-65
[11]彭蕾。本体论在数字图书馆领域的应用研究――以石棉制品特 色库为例,科技情报开发与经济,2009(19):1-4
[12]欧阳宁,包平,基于本体《中国图书馆分类法》的可视化实现,图书馆杂志,2008(1):28―32
[13]牟冬梅,范轶,数字图书馆领域本体的构建与推理――以医学领域本体为例,图书情报工作,2007,51(8):26―30
相关热词搜索:五年 本体 综述 近五年国内基于本体的数字图书馆研究综述 国内数字知识服务研究综述 中国美术基综述知识
热点文章阅读