[试论网络环境下图情类文献利用状况] 幼儿园环境创设图片

发布时间:2020-03-07 来源: 感悟爱情 点击:

  [摘要]运用文献计量学方法,结合数据库分析工具,基于1994-2006年40种图情类期刊在数量、类型、语种状况的41余万条引文数据,分析网络环境下传统学术期刊文献的利用、传播与老化规律;并专门针对期刊网络引文状况开展专项调查,从而揭示网络文献作为新兴文献类型的利用时效性与语种特征。最后,概括印刷型文献与网络文献的整体利用规律特点,以期为网络环境下的文献资源建设与用户服务提供参考借鉴。
  [关键词]网络环境 图情类期刊 引文分析 文献利用
  [分类号]G255
  
  科学引文作为学术信息交流传播的重要手段,其引用/被引关系实际蕴含着文献间利用/被利用的内在联系,可视为知识生产中文献利用的外在表征。因此,无论将引文作为实体文献分析,还是作为知识传播手段考察,都可借助年度数量变化、时间序列分布、引用半衰期以及类型结构变化等指标,考察文献利用的状况规律。本文选取图书情报学作为学科样本,以期刊引文作为数据来源,利用CNKI引文数据库的海量数-据,从引文历时分布和引文类型结构两个角度人手,综合分析了网络环境下的文献利用总体状况,以期能够客观反映文献利用在现阶段的某些规律。
  
  1 网络环境下文献利用数N与老化状况分析
  
  数字化与互联网技术一方面极大提高了传统印刷型文献的可获取性;另一方面也为数字文献的传播利用构筑了更为理想的平台,从而促使文献传播交流空前活跃,进而引发网络环境下文献利用总体状况的规律性变化。而此种深层次变化又通过期刊引文量、历时分布状况、文献老化指标等量化特征予以反映。
  
  1.1 网络环境下期刊引文数量状况分析
  网络环境下的文献利用对象与方式均获得极大拓展,数字化技术克服了传统纸质文献利用的时空障碍,而网络文献的出现也为用户提供了更为多样化的选择。因此,文献获取类型方式的日益丰富必然对文献利用产生深刻影响。
  从引文数量看,40种图情类期刊1994-2006年共引用文献416929条,见图1。
  
  从图1中能够清晰地看到文献利用量在网络环境前后所发生的巨大变化。以1998年为界,期刊引文量在此前(包括1998年)的5年间始终稳定在5800篇左右,最大增幅也不过17.6%;而自1998年起,期刊引文量开始呈现急剧增长态势,8年间年均增量为8922篇,年均增幅达37%,其中1999―2002年间增幅更是高达59.2%,可见网络环境下的文献利用量较传统环境有了大幅提高。
  究其原因,网络环境下的期刊引文量增长可能受多重因素影响,除文献可获取性增强以及传播范围扩展以外,文献生产趋于活跃也会在一定程度下带动引文量的提高。期刊历年发文量以及引文论文量变化趋势如图2所示:
  
  通过图2与图1增长曲线的比较可以发现,图2中年度发文量与含引文文献量始终处于稳定增长中,也就是说,文献生产状况并未在特定时间区间呈现出较其它区间差异化明显的增长态势,这显然与图1中期刊年度引文量增长趋势不相吻合。此外,著录规范化对于期刊引文的促进作用也不可忽视,而值得注意的是新闻出版总署恰恰于1999年印发了《中国学术期刊(光盘版)检索与评价数据规范(试行)》,倡导期刊著录规范化。但是,著录规范化对期刊引文量的影响只能是短期效应,这显然无法解释图1中长达8年的引文量持续增长,如图3所示:
  
  更具说服力的是,图3中文献篇均引文量与含引文文献篇均引文量年度变化表明,在排除文献生产及著录规范化因素对引文量的影响后,文献篇均引文量在1998年后整体仍表现出稳定持续增长态势,其在1998-2000年问增长尤为迅速,这也与文献数字化与网络存取在我国的普及时间不谋而合。因此可以初步判断,网络环境下文献在类型可获取性、利用方式、传播渠道等方面的变革,引发了期刊年度引文量自1999年的持续快速增长,并进而推动文献利用整体进入一个更高层次。
  此外,调查还发现,i994-2006年图情类期刊中含引文文献占文献总量的比例始终处于增长趋势,12年间累计增长了39%,从而进一步印证了网络环境下文献实际利用量的增长态势,同时也表明文献生产者的引文意识不断增强,知识生产中的文献利用行为也日趋规范化。此外,这一比例的持续上升还反映出网络环境下用户文献利用行为习惯的某些变化,可获取性的增强大大降低了文献获取和利用的时间成本与经济成本,从而促使文献生产者在科学研究与知识生产中倾向于利用更大数量与更多类型的文献,文献利用的数量与范围均获得相应提升。
  
  1.2 网络环境下期刊引文历时分布状况分析
  网络环境对于文献利用的影响不仪表现在引文数量增长层面,还反映在引文历时分布与半衰期变化规律方面,即对文献老化与利用时效性方而的影响。
  从期刊引文历时分布来看,40种图情类期刊约41万条参考文献贯穿整个20世纪至今,其中1970-2006年引文的历时分布呈现明显的抛物线趋势,具体表现为距今最近的5年引文量急速增长至峰值,而后逐渐回落直至平缓递减的阶段性态势,如图4所示:
  
  显然,图4中引文数量在文献利用周期内的规律性变化主要是由文献可获取性因素决定的。由于文献自身使用价值、利用方式等多重因素造成的实际可获取性在某一时期内的规律性变化以及学科发展、文献利用习惯等外部因素的影响,使得文献在其生命周期各时间点的被引状况均表现出数量上的不均匀分布,而各时间点的数量叠加最终形成图4中引文历时分布的抛物线形递增递减趋势。另外,网络环境下的文献利用不同于传统环境的~个显著特征便是数字化文献的普及,而这一特征对于文献生命周期内价值变化规律的影响也体现在图4曲线的阶段性变化中:由于版权保护和数字化生产周期等因素影响,期刊文献在发表后初期其数字化版本往往无法及时通过网络全文获取,从而影响到其即年被引量;此后随着文献数字化版本可获取性的增强,其利用量大幅增加,从而引发图4曲线急剧上升并在5年处达到峰值;峰值区间延续2年后,随着文献老化效应的显现,曲线开始自峰值逐年下降,从而进入数量递减期,直至老化效应对于文献利用的影响逐渐衰减,使得引文量变化开始在低数量水平趋于平缓,最终形成一个长尾。
  实质上,网络环境下文献整体利用的时间序列分布是由纸质印刷型文献、数字化文献以及原生网络文献三类文献的利用规律共同作用的结果,三者效应的叠加一方面促进了文献利用量在整个生命周期内的普遍性增长;另一方面也对其时间序列分布产生显著影响。此种效应对于文献利用数量而言主要表现为单纯的递增效应,而对于文献利用量的历时分布而言,则存在着文献自身及外部环境多重复杂因素的共同影响,从而体现出各阶段内不均衡的变化态势,图4曲线正是这些因素共同作用的结果。
  
  1.3 网络环境下文献老化规律分析
  通过统计图情类期刊1994-2006年度引文量与 2002-2006年被引量的时间序列分布,利用半衰期中值法,可计算出历年的文献引用半衰期与被引半衰期,进而洞察引文背后所隐藏的文献老化规律,如表1所示:
  
  通过表1可以发现,图情类期刊引用半衰期在2001年前后表现出两种截然不同的变化规律,1994-2001年7年间引用半衰期始终未表现出持续稳定的缩短或延长趋势,而自2001年起,期刊引用半衰期一改先前的震荡态势,逐渐呈现出规律性的持续增长特征,其中2006年较2001年延长了21.6%,表明文献老化出现了显著的减缓特征;而在2004-2006三年的被引半衰期中,半衰期延长趋势与老化延缓特征也同样明显。此外,计算机类期刊引用与被引半衰期数据也反映出类似的趋势,从而进一步印证了网络环境下文献老化延缓的现象具有一定的学科普遍性。通过表1中图情类期刊1994-2006年普赖斯指数变化同样可以看出,1994-1998年普赖斯指数平均值为O,677,而1999-2006年该指数平均值下降为0.643,这从另一角度印证了网络环境下文献老化的延缓特征。
  文献数字化浪潮兴起后不久,便有人预测可获取性的增强必将大大提高文献利用的时效性,从而加快文献老化速度。但是,从上文分析看,网络环境下的文献老化并未呈现加速态势,反而表现出某种减缓的迹象。实际上,期刊文献半衰期的上述变化恰恰反映出网络环境所引发的获取与利用变革在现阶段对于文献老化所产生的复杂影响,而此种影响可以通过数字化对于新旧文献利用的双重复合影响来获得合理解释。
  数字化对于文献老化影响的根源在于可获取性的增强。诚然,发表年限较新的文献能够借助数字形态的网络获取方式更快地为用户获取,从而大大提高自身利用的时效性。然而同时我们也应当看到,那些在传统环境下由于各种原因难以为用户获取或逐渐被人们忽视的“旧文献”,同样能够借助数字化实现可获取性的巨大提升,从而迎来新的利用高峰。甚至在实际利用中,由于受版权保护与数字化周期等因素影响,发表时间较短的“新文献”往往无法在第一时间通过网络获取,从而大大影响了其利用时效性,最终造成数字化对“旧文献”可获取性的影响实际上要大于对“新文献”的影响。
  因此,数字环境下“新文献”与“旧文献”利用量变化的相互叠加,共同决定了文献老化状况的整体变动趋势。而在当前环境下,数字化对于“旧文献”利用的促进作用实际要大于“新文献”,因而旧文献利用量的提升较新文献更为明显,从而形成半衰期延长与文献老化的延缓趋势。但是我们可以预见,此种现象只是当前所处数字化环境的一个阶段性特征,随着文献数字化的不断推进,其老化整体呈现延缓抑或加速趋势还应在今后进一步予以考察。
  
  2 文献利用类型与语种结构分析
  
  随着文献数字化的推进与互联网络的普及,各类型文献的利用状况必然受到不同程度的影响,从而表现出各自的数量变化趋势,并使得文献利用在类型结构与语种结构方面均表现出某些规律性特征。
  
  2.1 期刊引文类型结构分析
  期刊引文按照载体介质与存取方式可分为印刷型文献与数字文献两大类,而印刷型文献又涵盖期刊、专著、报纸、学位论文、标准等多种形式,数字文献则包括数字化文献与纯网络文献。以图情类期刊1994-2006年引文为数据源,通过程序自动判断,将416929条引文划分为11种类型,另有26422条引文类型程序无法判断,文献类型数量分布如图5所示:
  
  传统文献结构中扮演核心角色的期刊文献在网络环境下的文献利用中依旧占据主体地位,其被引量约占文献被引总量的60%。究其原因:一方面期刊发表周期短,时效性强,能够及时反映学科前沿最新研究成果,同时期刊文献经过严格审查与出版流程控制,学术水平较高,尤其核心期刊更是获得学界广泛认可,因而成为用户在文献利用中最为青睐的类型;另一方面,期刊数字化的蓬勃开展也在不断巩固着其在文献利用结构中的核心角色。此外,专著类文献依靠其较高的学术价值与理论系统性也成为文献利用的重要类型,约占文献被引总量的20%。值得注意的是,网页文献凭借其较高的时效性与可获取性优势,逐渐成为文献利用的重要类型,其累计被引量已占文献被引总量的10%以上,其份额还有日益提高的趋势。最后,排除程序未能有效判断的文献,其他7种类型文献被引量仅占文献被引总量的5,1%。由此可见,网络环境下不同类型文献在利用数量上存在显著差异,并在总体上呈现出明显的集中离散趋势,文献利用类型结构逐渐向期刊、专著和网页文献集中,而其他类型文献利用则趋于离散。
  
  2.2 期刊引文语种结构分析
  网络环境下的文献利用结构变革同样体现在其语种结构方面,不同语种文献在网络环境下的生产与可获取性差异,使得其利用状况也呈现差异性。40种图情类期刊所含416929篇引文中包括中文文献386355篇,外文文献30574篇,其1994-2006年历年语种分布与比例变化分别见图6与表2。
  
  由图6可见,1999年之前的引文语种结构以中文文献为绝对主体,外文文献在5年间累计被引量不过1851篇,年均被引量也仅有370篇;然而自1999年起,在中文与外文文献被引量均有所增长的前提下,外文文献呈现出更为明显的逐年递增态势,其在引文总量中的比例也不断提高。具体来看,1999-2006年外文文献年均被引3583篇,其中2006年被引量较1998年增长了18倍,1999-2006年均被引量较之前5年也增长了近10倍。此外,由表2可以看出,外文引文在引文总量中所占比例自2001年后也呈现持续增长态势,由1994-2001年的年均6.32%上升到2006年的9.69%。由此可见,网络环境下外文文献利用数量不断增加,利用范围不断增强,从而引发文献利用语种结构发生相应变化。
  
  3 网络文献利用状况分析
  
  网络文献,是指Web网络中具有稳定的URL地址,通过HTTP协议传递且能够明确识别其网络来源的文献。网络文献的普及可称得上是文献利用史上的一次革命,它从根本上提高了文献的可获取性、传播范围与利用效率,并在潜移默化中改变着用户的文献利用内在心理与行为习惯,从而成为网络环境下文献利用的标志性特征之一。
  
  3.1 网络文献利用数量状况分析
  40种图情类期刊在1994-2006年的416929条引文中共包含网络文献45225条,约占引文总量的10.85%,其年度数量分布见图7。
  通过图7与图1比较可以发现,网络引文与期刊总体引文在年度数量曲线表现出一定的相似性,即以1998年为界,前段平缓发展其后逐年增长的阶段性变化趋势。然而,网络文献自身特点又使得其利用量增长必然有着区别于传统文献的特征。从图7看,图情类期刊网络引文最早见于1995年,此后4年数量增长 不大,分别为2篇、2篇、25篇和62篇,与同时期引文总量相比,始终处于低数量水平。直至1999年,网络文献被引量开始显著增长,年度数量达到588篇,较1998年增长了840%,而截至2006年被引量更是高达11753篇,较1998年增长了近190倍,同时1999-2006年均增量也达到619篇,平均增幅高达157%,而与之相比,同时期期刊引文总量增幅却仅有37%。由此可见,网络文献利用较传统文献表现出更为迅猛的发展趋势,同时也表明网络环境下以数字形式生产与传播的文献具有更大的优越性。此外,网络文献引用量的持续快速增长也表明学术界在网络文献出现早期对于它的种种质疑并未成为阻碍其发展的桎梏,其文献质量与学术价值正在获得日益广泛的认可。
  
  3.2 网络文献老化研究分析
  迄今为止,传统文献老化研究领域已经形成了以半衰期和普赖斯指数为主要指标,以负指数模型、巴尔顿一凯普勒老化方程、布鲁克斯老化方程等为核心方法的研究体系,而网络信息资源老化相关研究则始于20世纪90年代末。Bar-Ilan和Peritz在1998、1999年,对网络信息计量学领域的信息进行了研究,发现在6个月内近50%的网页发生了变化,1年后68%的网页被从网上移除。2000年5月,Steve Lawrence对从ResearchIndex数据库收录文献的引文中提取的67 577个URL进行了可访问性追踪,发现前1年发表的文献引用的URL已经有23%无效,1994年发表的文献引用的URL无效的高达53%。Diomidis Spinellis利用期刊IEEE Computer和Communications of the ACM文献中的引文进行了类似研究,表明URL的半衰期是4年。Michael Bugejal和I)aniela v,Dimitrova在2005年和2007年发表的文献中指出通讯类期刊的网络引用半衰期为3.17年。
  实际上,网络信息数量巨大、类型众多、变动频繁、发布自由的特点使得对网络文献老化规律的测度较传统文献更为复杂。网络文献的动态性与非累积性使得海量网络信息始终处于变动当中,资源一经修改便会自动覆盖掉其原始信息,造成其原始创建和发布时间获取非常困难,同时网络信息的海量与飞速增长也加剧了其老化测度的难度。因此,网络资源自身的复杂性动态性与网络空间的不确定性使得目前尚难以通过全面的定量测度精确考察网络文献的老化状况,因此更需要我们针对网络信息自身特点采用创新性思路与方法开展网络资源老化研究。
  
  3.3 网络文献语种结构分析
  由于期刊在网络文献著录中多以网络URL作为文献名称,而计算机程序对于以字符形式表现的URL地址往往难以准确判断其语种类型,因此只能通过小范围的手工统计方式考察网络文献大致语种状况。笔者选取2002-2006年7种图情核心期刊作为研究样本,从每本期刊挑选10篇文献作为样本单元,对文后所附参考文献中网络文献的中外文比例进行了考察,如图8所示:
  与图6中期刊文献整体语种结构不同,网络文献中外文比例虽在五年间略有变化,但并未表现出明显的规律性变化趋势,而是存在一个大致稳定的比例值2.5:1。将其与引文整体语种结构对比,能够发现网络文献利用与印刷型文献在语种结构方面的巨大差异。对于印刷型文献来讲,目前可获取的外文文献较中文文献在数量上并不占优势,加之外文文献自身语言障碍等问题,造成其利用量要远远低于中文文献;与之相比,网络引文语种状况则恰恰相反,互联网络的开放性与全球性使得中文网络文献丧失了可获取性方面的优势,而仅仅是语言因素尚难以弥补两者在学术质量和可获取数量上的巨大差距,因而中文网络引文要远少于外文。此外,图8还从另一个角度揭示出了用户在利用不同语种文献时的获取习惯问题,即用户利用中文文献时往往倾向于选择印刷型文献及其数字化版本,而利用外文文献时则会更多地考虑通过网络直接获取文献资源。这种文献获取习惯的形成原因来源于多个方面,除上文提及的印刷型文献与网络文献在数量、语言障碍、可获取性等方面的差距以外,还与两类文献的时效性以及自身质量差异有关。
  
  4 结 语
  
  文献的数字化与网络化作为文献利用的革命性发展,不仅表现为文献利用对象与存取方式的演进,更对文献利用的年度数量、类型结构乃至文献老化等多层面产生深刻影响。通过以图情类期刊为样本的引文分析,可概括出网络环境下的文献利用具有以下特点:①文献类型日益丰富,利用类型结构呈献出非均衡性发展,网络文献成为新兴的重要类型;②用户文献利用习惯日趋规范化,含引文文献量、篇均引文是与发文呈同步增长;
  
  [作者简介]索传军,男,1964年生,教授,博士生导师,国家图书馆研究院院长,发表论文50余篇,出版著作5部。游毅,男,1984年生,硕士,发表论文3篇。

相关热词搜索:下图 试论 文献 试论网络环境下图情类文献利用状况 论网络环境下文献资源共享 图书情报

版权所有 蒲公英文摘 www.zhaoqt.net