[《中国图书馆分类法》索引的演变和展望] 图书分类5大类22小类
发布时间:2020-03-10 来源: 幽默笑话 点击:
[摘要]通过对《中图法》第2-4版索引编制技术的比较,总结分类法索引的编制从单一技术到多种技术相结合、从纯手工编制到计算机编制、从印刷版到电子版和网络版演变的发展趋势,并从架构、编制方法与用户群体三方面展望新版《中图法》索引的编制。
[关键词]《中国图书馆分类法》 分类法索引 机编索引 电子索引
[分类号]G353.21
《中国图书馆分类法》(原名《中国图书馆图书分类法》,以下简称《中图法》)是我国图书馆和情报机构普遍使用的一部综合性的分类法。它主要从知识分类的角度揭示文献内容的区别与联系,按学科和专业集中文献,提供从学科和专业出发检索文献的途径。《中图法》一直十分重视分类法索引的编制,因为分类法索引是图书分类法的一个不可缺少的组成部分,是一种从概念指向分类号的指引类目查找的检索工具。它为用户提供了一条按字顺查找、利用分类表和分类目录的途径。
《中图法》第一版没有配备索引,第二版和第四版均配备了索引,第三版虽然没有编制专门的索引,但《中国分类主题词表》(以下简称《中分表》)的第二卷《主题词一分类号对应表》也可看作是一种叙词表式的索引。本文从索引编制技术的角度,从索引类型、编制方法、款目结构和排序四个方面对《中图法》第二、三、四版索引进行比较和分析,从而论述索引编制技术演变对索引性能的影响。
1 索引类型的比较
分类法索引有直接索引、相关索引、叙词表式索引、关键词式索引及链式索引等多种类型。
直接索引只是把类名及注释中的表示主题概念的语词取作索引标目,一般都不设置倒置标题或副标题。它编制简单但质量较差,不便于查找按学科分散的相关主题,所以现在已很少使用。
相关索引是针对直接索引的缺点发展起来的,通常按标题法的原理编制,通过设置副标题、倒置标题、说明语等增加聚类功能,提高检索效率,目前被广泛使用。第二版索引正是属于标题词型相关索引。例如:
病原细菌学(兽医) S852.6
玻璃制品
―包装 TQ171.6+9
一加工工艺 TQ171.6+8
一再成型工艺 TQ171.6+8
,建筑用一制造 TQ171.74+2
,日用一制造 TQ171.74+6
……
第三版索引属于叙词表式索引。这种索引是一种基于分类表与叙词表之间的密切对应关系而研制的索引,索引的款目增加了用、代、族、参等项参照(属分隐含在族项参照中),加强了词间关系的显示,从而使得它具有了主题标引和检索的功能,而不仅仅只是分类法的辅助部分。该表以《中国分类主题词表》的字顺表为主体,增加了大量以相交、限定等组配方式组配而成的主题词串,将《中图法》(第三版)的全部分类号置于相应的主题词或主题词串下。例如:
测量仪
Y 测量仪表
测量转换器
TP62⑨;1TH867⑨I
D 比例式测量转换器
z 转换器
测频扩展法
TM935.1⑨
c 取样法
c 外差法
插值一函数论
0174.42
茶树一饮料作物
S571.1
第四版索引采用了将链式索引与题内关键词索引(KWIC)结合起来用计算机编制的方法,为分类法索引的编制提供了一条全新的思路。链式索引法是一种通过对类链的分析而择取索引标目、编制索引的技术。它利用了类目与主题词之间的对应关系,在字顺序列中再现了分类体系,对任何文献都同时提供了从概括主题和专指主题进行检索的途径,增加了检索人口,在检全率及易用性方面有着相关索引无法比拟的优势。同时,由于链式索引法可以半机械地从分类表的类链上择取索引款目,操作简单,使索引的计算机编制成为可能。传统的题内关键词索引将关键词连同其上下文一起实行循环轮排,移头接尾或移尾接头,把每一个关键词轮排到检索入口的位置,如果题名超过规定的长度,可以截断。这使得题名的完整性得不到保证,从而降低了款目的可读性。第四版索引为了克服这一缺点,在款目格式上不实行截断,也不实行移头接尾或移尾接头,从而保证了标目的完整性及可读性。例如:
▲ ▲检索入口
球面天文学 P121参见0124.2
农业机械化 区划 S231.1
园艺 ↓
作物地理分布及 区划 S601.9②③
自然 区域(地理学)TV42+3
2 索引编制方法
第二版索引是武汉大学图书馆学系张琪玉教授与其他多位教师历时一年多编制而成的。该索引收录了《中图法》(第二版)和《中国图书资料分类法》(第二版)这两种分类法中已列出的全部有检索意义的概念,其编制步骤包括:分析类目、确定标目、拼接款目、抄成卡片、轮排、排序、校对及定稿。受当时的条件所限,索引的所有编制工作都是使用卡片,手工完成,耗时费力。
第三版索引是在《中国分类主题词表》第1卷――“分类号一主题词对应表”的基础上作反向对应,由计算机自动生成的,因而第三版索引的编制可以说是半自动的。其编制首先列出与类名概念相对应的主题词,然后列出与类目所包含的或注释中列出的概念相对应的主题词。
第四版索引是南京农业大学信息管理系侯汉清教授带领几位学生采用人机合作的方法用三个月时间编制而成的。该索引所选择的索引方法――链式索引法本身就是一种可以半机械地生成索引款目的索引技术,而题内关键词索引(KWIC)则可通过计算机实现充分轮排,用计算机辅助编制无疑是当时最佳的选择。索引的范围包括了类名和注释表达的概念、类名的同义词及各种复分表中出现的概念。第四版索引的编制充分利用了计算机相对于人脑高速、准确的特点,由计算机完成大量机械、重复的劳动,而由人工做一些智力型的工作。
3 索引款目结构
索引款目是索引的基本单元,其作用是指引用户识别和查找某一文献或文献库中的具体项目或这些项目中所包含的情报,并通报其确切地址。索引款目主要包括标目和出处,有时还提供标目的限义词和注释。现就索引的款目构成、款目格式及参照系统三个方面对第二、三、四版索引作比较如下:
3.1 款目构成及款目格式
通过比较,我们不难发现,三个版本中以第二版索引的款目格式最为复杂多样,款目格式的一致性及款目的可理解性较差,第三版以限定组配(以“一”为标志)为主,而第四版索引的款目格式与自然语言最接近,可读性最佳。
3.2 参照系统
交互参照是索引的重要组成部分,有助于全面、完整地显示索引标目之间的复杂联系。三个版本的索引都配备了各具特色的参照系统。
第二版索引的绝大部分索引款目都直接给出了分类号,但为了避免索引款目的过多重复,同时增加查检途径和字面成族的机会,还是用了大约一千条“见”参照(直接参照)和“查”参照(一般参照)。其中, “见”参照里既有同义词之间或不同词序之间的参照,也有多音字的参照,而“查”参照则告知用户使用索引的方法。例如:
教育,中等见中等教育
剥壳机见剥皮机
薄(bo)见薄(báo)
病因,某种疾病查该种疾病
第三版索引的参照系统是其一大特色,所有的单个主题词下都建立了包括Y、D、Z、C及等级关系全显示的参照系统。例如:
擦光蜡
Y 上光蜡
采光 J914
D 建筑采光
Z 照明设计
C 布光
测量学 P2①
?大地测量学
?高等测量学
??精球面测量
?普通测量学
?摄影测量学
?天体测量学
第四版索引的参照有两类:一类是多音字参照(用“另见”表示);另一类用于压缩轮排款目的参照(用“一”表示)。后一类参照分为两种:一是对于一些通用词或出现频率较高的词,一般不予轮排,而为之配置一般参照(或称说明参照),指示查找的方法;其二是对于一些非通用词采用见参照,以指引检索人口词,消除重复轮排现象。例:
▲检索入口
薄(bao)另见薄(bo)
薄(bo)另见薄(bao)
调查一此词素不轮排,各种调查请查其他词素,如水文调查从水文查起。
森林防火一森林防火
通过比较可以发现,第二版索引中用于指示多音字的“见”参照与第四版索引中的“另见”参照作用相同,只是第二版索引只做了单向的参照而第四版索引做了双向的。第二版索引中用于指示同义词和不同词序的“见”参照与第三版索引中的“Y”参照作用相同,第四版索引则没有编配这种类型的参照,而是直接给出了相应的分类号。三个版本的索引中,以第三版索引的参照数量最多,大量的参照给用户的相关检索提供了方便,但同时也使得索引的篇幅大量增加。
4 索引款目排序
三个版本的索引款目都是按照标目的汉语拼音顺序排序的。其中第四版索引采用了双向排序法,检索入口词及下文从左向右顺序排列,上文从右向左逆序排列。两种排序方法的比较如图2所示。
5 电子版索引简评
2001年6月,《中图法》电子版问世,这是我国第一部电子分类法。《中图法》电子版对印刷版进行了升级改造,不仅使纸质版本电子化、数字化,而且增加了类目评注、全文检索、通用的编目接口、多方式快速精准检索,多层面多窗口多形式显示等功能。这些改进在提高标引效率、界面友好性以及兼容性的同时,还减少了维护难度及成本,为我国基于《中图法》的分类一主题一体化系统的研制以及未来向高级知识组织系统(KOS)的发展奠定了基础。
2005年,历经五年修订的《中分表》第2版出版,而一同出版的《中分表》电子版则可被看作此次修订的最大成果。《中分表》电子版是在《中图法》第四版机读数据库、《中分表》编制规则以及叙词机读数据库的基础上编制而成,具有多文档、多窗体、多浏览检索方式等优点,具有结构化全文检索功能,而无处不在的超链接也极大地改善了易用性,可以方便地实现分类主题一体化的扩检。
当然,《中图法》和《中分表》的电子版也存在着一些缺陷。例如《中图法》电子版不区分用户对象,一揽子推出过多的统计和研究功能,为普通用户的使用带来了不便。又如软件功能不够完善,不具有二次检索功能等。此外,《中分表》电子版并未使用《中图法》第4版索引的数据,导致部分概念缺失。例如,类目“TJ768发射设施”的注释为“总论火箭、导弹的发射、运行、指挥、跟踪、遥测、遥控等设施的著作入此。”《中分表》与其对应的主题词或词串为:“导弹发射装置”、“导弹发射\设备”、“军用船”、“导弹发射装置”、“发射筒”、“发射箱”。显而易见,这些主题词或词串中并未包括“导弹运行设施”、“导弹指挥设施”、“导弹跟踪设施”、“导弹遥测设施”及“导弹遥控设施”等相关概念。
6 《中图法》新版索引展望
《中图法》的修订工作已接近尾声,第五版《中图法》的正式出版指日可待,新版《中图法》索引的编制因而也应被提上日程。下文从架构、编制方法、用户群体等方面对新版索引的编制进行展望。
6.1 从单机版到网络版
《中图法》及《中分表》电子版的问世,在我国分类法及其索引的发展史上具有里程碑意义。然而,纵然电子版的《中图法》及《中分表》给我们带来了多窗口、多检索途径、个性化设置等全新的用户体验,C/S架构却注定了它们无法满足检索语言工具在网络环境中的应用需求。与此同时,电子化的分类法及索引虽能在一定程度上减少维护的难度及成本,却因为无法频繁再版,维护周期仍会长达数年。为此,《中图法》编委会已启动了《中图法》和《中分表》的网络版研制工作,旨在使其不仅能实现持续更新及用户对新数据的即时获取,还能通过镜像方式提供连接本地网络实现联机目录(Web OPAC)的功能,为用户提供主题检索或分类检索服务。因此,新版《中图法》索引在继续出版其纸质版的同时,也必须走网络化的道路,实现动态维护,满足网络环境中检索和标引的各种需求。
6.2 从手工编制到自动编制
虽然从第三版索引开始,计算机已在《中图法》索引的编制过程中充当了重要角色,部分代替人处理了大量机械性工作,在提高准确率的同时,节约了大量人力和物力,但是,仍属于计算机辅助编制的索引,即机器和人共同分担完成的索引。即便是在计算机参与程度较高的第四版索引的编制过程中,仍需要首先对分类表数据进行手工处理,添加一些专用符号,利用计算机将类名和注释处理成独立、完整、语义明确的主题概念,还需要进行人工分词等。新版索引应当提高索引编制的自动化程度,减少人工干预。可以借鉴中文自动标引的成果,试验以类目、注释、上位类、下位类以及类目对应的主题词或词串,作为标引数据源,进行加权自动标引的试验,加速《中图法》索引编制的自动化和智能化的进程。还可以借鉴领域本体研究的技术,全面实现《中图法》的可视化。
6.3 从面向标引员到面向普通用户
长期以来《中图法》索引将终端用户定位为图情工作者,而分类法和索引的普及化趋势使得新版《中图法》索引有必要将用户群体从标引员扩大至普通用户。事实上,《中分表》网络版的研制正是这方面的有益探索。除了第四版索引以外,第二、三版索引均大量使用概念组配,强调科学性和规范性。然而,普通用户更多会使用“免疫球蛋白测定”而不是“免疫球蛋白\免疫测定”进行检索。因此,《中图法》索引要面向不同水平、不同文化程度和学科背景的普通大众,就必须贴近用户使用习惯,提高自然语言检索能力。而提高自然语言检索能力的措施之一就是大量增加高先组度的词组。在索引日益电子化和网络化的今天,索引规模已不再成为问题,新版电子版索引可考虑在采用概念组配的同时,吸收第四版索引数据,收录大量词组,提高索引的易用性和可读性。
7 结语
纵观《中图法》第二至第四版索引的编制过程,我们可以得出一个结论,即分类法索引的编制技术在不断改进和完善,其中包括:由印刷版向电子版发展,由单机版向网络版发展,由单一技术向多种技术集成发展,由纯手工编制向计算机的自动化编制发展,采用的检索语言由标题语言、叙词语言向自然语言发展等。
虽然《中图法》索引的发展趋势是电子化和网络化,但鉴于不同用户的应用环境与使用习惯不尽相同,在现阶段保留印刷本仍有必要,日后渐渐过渡到以电子版与网络版为主。鉴于《中图法》索引印刷版的篇幅呈现不断膨胀之势,印刷版索引的编制必须在检全率与索引规模之间寻求一个平衡点,解决办法之一是为电子版与印刷版设定不同的详尽程度。除此之外,尽量贴近用户的阅读习惯,增强款目的可读性亦是印刷版索引编制中应考虑的因素。
综上所述,纵然《中图法》索引可选取不同类型的索引,但编制技术的多样化、编制过程的自动化以及操作的智能化必将是共同的发展趋势。
相关热词搜索:分类法 中国 演变 《中国图书馆分类法》索引的演变和展望 中国图书馆分类法 中国图书馆分类法f
热点文章阅读