[国内机构知识库研究文献的可视化分析] 机构知识库与文献管理领导者

发布时间:2020-03-10 来源: 日记大全 点击:

  摘要:利用信息可视化工具CiteSpace对CSSCI数据库收录的2004-2010年国内机构知识库研究文献进行分析:根据被引期刊分析确定该领域核心研究期刊,依据作者一机构共现分析寻找该领域主要研究力量并介绍各团队研究重点;通过对关键点文献的分析反映知识网络形成与演进过程;以关键词时区视图揭示各阶段研究热点及其变化情况,并介绍主要研究成果:
  关键词:机构知识库 CiteSpace 可视化分析
  分类号:G250
  1、引言
  机构知识库(institutional repositories,简称IR),又称机构库、机构仓储、机构典藏库,是收集、存放由某个或多个学术机构(例如大学、研究所、图书馆、博物馆等)专家、教授、学生创造的、可供机构内外用户共享的学术文献的数据库,最早于2004年出现在国内研究文献中。随着机构知识库的发展与文献数量的不断增加,有必要对研究现状进行归纳总结。目前已有一些相关综述出现,但这些研究大都基于传统的文献计量方法,没有结合一些实用的分析呈现工具,其结果在可理解性与通俗性方面存在不足。利用信息可视化方法则能弥补这一缺陷。信息可视化是指将大量的数据、信息和知识转化为人们可以直观、形象理解的图形或图像,从而可以直观、形象地表现、解释、分析、模拟、发现或揭示隐藏在数据和信息内部的特征与规律,提高人类对事物的观察、记忆和理解能力及整体概念的形成。本文利用CiteSpace可视化分析软件,结合当前比较热门的科学计量学方法对已有研究进行梳理,绘制该领域知识图谱,力求揭示国内机构知识库研究的知识网络与研究热点演进,以供参考。
  2、数据来源与研究方法
  以中国社会科学引文数据库(CSSCI)作为来源数据库,分别以“机构知识库”、“机构库”、“机构仓储”、“机构典藏”为题名,以2004-2010年为检索时间段(检索时间为2011年2月16日,国内首篇机构知识库研究文献发表于2004年),经过查重及不相关处理后,得到文献130篇。
  
  分析工具采用陈超美博士开发的CiteSpacet软件,并利用刘胜波博士开发的转换工具将CSSCI数据转化为WOS格式。将转换后的数据导人CiteSpace,设置主题词来源为文献标题、摘要、关键词和标识符,“time scaling”为1,即将2004-2010年分为7个时段进行处理。分段处理有利于辨识学科研究的突出拐点和学科前沿的动态模式,同时提高软件运行速度和准确度。
  3、可视化分析
  3.1 时间分布
  国内机构知识库研究文献的时间分布曲线见图1,根据图中数据,可将国内机构知识库研究分为三个阶段:2004-2005年的引入阶段、2006-2007年的探索阶段以及2008年之后的快速发展阶段。作为相对较新的一个研究研域,机构知识库在国内的发展势头良好,其研究文献的数量将继续增加。
  3.2 被引期刊分析
  对一个学术领域做期刊分析能够确定该学科的核心期刊分布,而对核心期刊的文献共引频次的分析则能反映出该期刊所刊登文献的利用率及其含金量。选择网络节点类型为“被引期刊(cited journal)”,设定阈值(1,1,20)、(2,2,20)、(1,1,20),采用最短路径算法(pathfinder)进行剪裁,生成的被引期刊图谱如图2,关键节点信息如表1所示:
  图中标签显示为“N”的最大节点代表学位论文,带有深色边缘的节点中心度均大于0.1,是整个网络中的关键节点。通过图2和表1数据可以看出,学位论文在被引频次和中心度上都居于首位,最具学术价值。其他期刊按中心度由高到低依次为《图书情报工作》、《中国图书馆学报》、《数字图书馆论坛》、《图书馆杂志》和《情报资料工作》;另外《大学图书馆学报》在被引频次和中心度上也相对较高,这些期刊作为机构知识库领域的核心期刊,刊载文献具有较高参考性。
  
  3.3 主要研究力量分析
  利用CiteSpace的作者与机构统计功能,可以绘制作者、机构共现图谱,进而识别该领域的主要研究力量。节点类型选择作者(author)与机构(institution),数据抽取对象为前30,得到机构知识库领域主要研究力量的图谱,如图3所示:
  图3中包含10个经过聚类的簇,每个簇代表一个研究团队,由合著作者(不区分第一、二作者)及其所在机构节点构成,节点标签大小由频次高低决定。可以看出,目前国内机构知识库研究已经形成比较核心的研究团队,中国科学院国家科学图书馆、兰州分馆、中国科学院研究生院等机构形成以中国科学院为主体的该领域核心研究力量;另外,吉林大学管理学院、南京大学信息管理系和嘉兴学院图书馆、厦门大学图书馆等机构也是推动该领域发展的重要力量。通过对每个团队发表的文献进行分析,可以进一步揭示各团队研究重点及国内机构知识库研究力量的整体分布情况(见表2)。
  3.4 知识网络分析
  通过CiteSpace可探测和分析学科研究前沿的变化趋势以及研究前沿与其知识基础之间、不同研究前沿之间的相互关系,能够较为直观地识别学科前沿的演进路径及学科领域的经典基础文献。选择网络节点类型为“引文(cited reference)”,使用Jaccard系数进行度量,数据抽取对象为前15,得到文献共被引网络,经Pathfinder算法修剪后如图4所示:
  图4显示了机构知识库研究知识网络中的关键节点,通过对关键节点文献进行分析,可以对该领域的发展与演变有所了解。各关键点信息如表3所示:
  从图4及表3中可以看出:
  ?吴建中的《图书馆Vs机构库――图书馆战略发展的再思考》一文中心度与被引频次都居于首位,是国内机构知识库领域最重要的一篇文献。文中介绍了国外机构知识库的起源、发展、定义及影响,提出图书馆应与时俱进,重新确立在知识交流中的核心作用。该文为网络环境下图书馆的发展指明方向,同时揭开了国内机构知识库研究的序幕。
  
  ?姜瑞其的《国外机构库发展概况》分析了机构知识库的资源内容、技术系统和管理方式,并阐明管理系统和资源内容的提交过程。通过对具体案例及软件平台的介绍与分析,使读者对机构知识库的理解更加直观。
  ?董文鸳的《聚集学术机构知识的中心:机构库(Institutjonal Repositorv)探析》分析了机构知识库的起源与特点,根据国外案例分析机构知识库经费预算与管理,为国内机构知识库发展提供参考。
  ?郭少友的《机构库建设的若干问题研究》针对模式选择问题、法律问题及内容建设问题,借鉴国外已有成功经验,从实际情况出发提出一些建设性意见,对于国内机构知识库的实际建设具有很强的针对性与指导性。
  ?郭淑艳的《基于开放获取的机构知识库的研究》详细介绍了开放获取和机构知识库理念,并调查了科研人员提供开放获取的现状。该文是国内首篇 研究机构知识库的硕士学位论文,通过对相关理论进行系统梳理,丰富了国内机构知识库研究内容。
  ?李广建的《IR:现状、体系结构与发展趋势》则从技术角度探讨了机构知识库系统的结构、功能等内容。文中综合考虑各专用系统、开源软件及商业系统,抽象出机构知识库系统模型,具有普适性。另外,其对于机构知识库发展趋势的探讨也可供借鉴。
  ?其他。还有一些重要文献,如:常唯的《机构知识库:数字科研时代一种新的学术交流与知识共享方式》分析了机构知识库在数字科研环境中对知识创造、转化与共享的积极作用;袁顺波的《机构库的起源、影响及图书馆的应对策略》探讨了机构知识库对学术机构、传统出版模式和学术交流体系以及图书馆的影I响,提出图书馆应对策略。这些文献与关键点文献共同为国内机构知识库研究奠定了理论基础,通过这些文献即可对机构知识库研究进行整体了解。同时,文献共被引分析结果也显示,被引文献中超过一半来自国外,这一方面说明我国机构知识库研究人员比较关注国外最新成果,能够紧随国际趋势,但另一方面也反映我国机构知识库研究尚未形成自身特点与优势,有待加强。
  3.5 研究热点分析
  关键词在一篇文章中所占的篇幅虽然不大,但却是文章的核心与精髓,是文章主题的高度概括和凝练,因此对文章的关键词进行分析,频次高的关键词常被用来确定一个研究领域的热点问题。选择网络节点类型为关键词(keyword),数据抽取对象设置为前30,将结果以时区视图(tinlezone)显示,得到图5。
  3.5.1 研究热点演进分析
  由图5可知:
  ?2004年除“机构库”外尚未出现其他关键词,因为这一年仅有一篇文章《图书馆VS机构库――图书馆战略发展的再思考》,但从图中可以看出,该节点中心度与频次都较高,且之后各年研究热点均与之有连接,是国内机构知识库研究的起源。
  ?2005-2006年机构知识库研究文献数量有所上升,此时期对机构知识库的研究主要集中在开放获取运动以及机构知识库在促进学术交流和知识共享方面的重要意义等方面。而最受人关注的则是机构知识库对图书馆尤其是高校图书馆和数字图书馆的影响以及应对策略。
  ?2007-2008年是国内机构知识库发展的重要时期,这一阶段的研究在数量以及深度与广度上都有所突破,机构知识库建设与应用过程中面临的知识产权、内容收集、质量控制以及长期保存等问题成为研究热点并持续至今,其研究成果不仅为解决实际问题提供了参考,更推动了这一领域的研究不断深入。同时,随着机构知识库的实际建设工作的逐渐开展,对于各种系统软件的比较分析以及评估方法也开始受到重视。在构建机构知识库的各种商业软件及开源软件中,由美国麻省理工学院图书馆和惠普公司开发的DSpace系统最受国内学者青睐,对该系统功能结构及安装汉化方法的介绍掀起了另一波研究热潮,是机构知识库实际建设中的另一重点。
  ?2009-2010年国内对于机构知识库的研究不断深入,前一阶段的研究热点依然受到人们关注,同时对台湾地区机构知识库建设以及机构知识库联盟的探讨也成为这一时期的研究热点。台湾地区机构知识库建设始于2005年,由台湾“教育部”委托台湾大学图书馆进行规划,2006年又由台湾大学图书馆牵头进行了为期3年的“建置机构学术成果典藏计划”,经过种子学校复制和TAIR联盟的建立,台湾地区不仅极大地提高了机构知识库数量,同时增强了学术研究成果影响力,其机构知识库建设水平目前处于国际先进水平,其成功经验可以为内地提供参考。中国科学院则在机构知识库联盟方面进行了丰富的理论研究与实践。
  3.5.2 研究重点分析通过对国内机构知识库研究热点演进情况的呈现与分析,可以看出版权问题、内容收集和质量控制问题最受关注,同时也是机构知识库研究的难点,下面重点针对这两个问题进行分析。
  ?版权问题。机构知识库建设中面临的版权问题主要包括两个方面:建库软件的版权问题以及收录资源的版权问题。前者由于开源软件的广泛使用一般不会引起知识产权纠纷;后者则涉及出版商、作者、机构知识库等多方主体,并根据收录资源属后印本还是预印本而有所不同。
  对于后印本,由于作品版权已全部或大部分转属出版商,版权问题的处理需从“作者一出版商”和“机构知识库一出版商”两方面进行。对于前一方面,国外有些组织为作者提供允许其进行自存储的出版商名录供其投稿时参考,使文献发表后仍可以被收入机构知识库。例如英国诺丁汉大学的ROMEO项目。另外也有学者介绍了能够在现行出版模式中为作者争取权利的“作者补遗模式”。对于后一方面,张晓林提出应积极争取以机构名义与本领域主要出版商签订保留本机构作者存缴与开放传播权利的集体协议,并作为范本供机构成员在通过其他出版商发表论文时使用。中国科学院于2010年10月27日与施普林格科技与商业媒体集团签署开放存取合作协议,允许施普林格所出版期刊的中国科学院作者将所发表论文的最终审定稿存储在研究所知识库中。中国科学院是亚太地区首家达成这类协议的机构。
  对于预印本,通常从规范机构知识库与提交者之间的许可协议人手。加利福尼亚州立大学图书馆制定的机构库eScholarship Repository协议被公认为目前最全面的协议,该协议规定了提交人赋予机构库的权利以及机构库和提交人需要承担的义务。有文献从提交者申明、提交者权利、机构知识库的权利和责任以及提交作品的删除4个方面介绍了机构知识库许可协议应具备的内容。创作共用协议。等开放性协议的推广也为解决版权问题提供了新的途径。
  ?资源建设。机构知识库资源建设由资源收集和质量控制两部分组成。
  ――资源收集。资源收集方式包括分布式、半分布式和集中式三种,从灵活性来看,分布式最优,集中式最差;从资源收集数量来看,则集中式最优,分布式最差。三种方式可以单独使用,也可以相互结合。从机构知识库长远发展来看,分布式自存储是最为重要的资源收集方式。影响机构知识库分布式自存储的因素主要包括:认知度、科研评价、版权、技术、政策等因素,解决的策略则可以总结为:加强宣传、方便提交、及时沟通、建立科学评价与激励机制、解决版权问题、进行质量控制以及多方交流合作等。也有学者通过问卷等形式对资源提交者的提交意愿及行为方式进行实证调查,并提出一些有指导性的意见。文献运用心理学方法对资源提交者心理进行研究,从新视角探讨了机构知识库资源建设。
  ――质量控制。收录资源的质量控制同样因收集方式而异,半分布式与集中式的质量控制相对容易实现,而分布式收集资源的质量控制则相对较难,也是质最控制的主要研究内容。文献提出从元数据级和内容级进行控制,文献在此基础上又加入数据访问质量控制,并详细论述了三个级别的实施策略。文献则根据进行质量控制的叫机,从预先控制、过程控制、事后控制三个层次介绍了质量控制策略。总体看来,国内对于机十勾知识库质量控制的研究已取得一定成果,但还有待加强。
  4、结论
  利用信息可视化工具CiteSpace对CSSCI数据库收录的2004-2010年国内机构知识库研究文献进行分析得到如下结论:①《图书情报工作》、《中国图书馆学报》、《数字图书馆论坛》、《图书馆杂志》、《情报资料工作》以及《大学图书馆学报》6种期刊具有较高中心度及被引频次,是国内机构知识库领域核心研究期刊,刊载文献具有较高参考价值。同时,相关的学位论文对于我国机构知识库研究的发展也起到巨大作川。②中国科学院国家科学图书馆兰州分馆、吉林大学管理学院、中国科学院国家科学图书馆等机构的研究团队构成了目前国内机构知识库的核心研究力量,且各团队研究重点有所不同。③《图书馆VS机构库――图书馆战略发展的再思考》、《国外机构库发展慨况》等关键点文献为机构知识库在国内的研究与发展览定了,基础,对知识网络演进具有重要意义。④机构知以库研究热点在各个时期有所不同且逐年增多,各热点的研究成果不断丰富,推动我国机构知识库研究不断发展。但我国机构知识库研究尚未形成自身特点与优势,还有待进一步深入。

相关热词搜索:可视化 知识库 文献 国内机构知识库研究文献的可视化分析 文献计量可视化分析 文献可视化分析软件

版权所有 蒲公英文摘 www.zhaoqt.net