[基于可视化技术的知识提取研究]可视化提取熏显箱中标
发布时间:2020-03-07 来源: 历史回眸 点击:
[摘要]探讨如何利用可视化技术实现知识提取:基于可视化技术的知识提取首先将隐性知识以可视化的形式表示出来;然后,对知识的内容、结构以及可行性等方面进行评价;最后,根据评价结果形成最终的显性知识,存入知识库。指出基于可视化技术的知识提取需要一定的沟通机制和促进机制。基于可视化技术的知识提取平台设计应遵循一定的原则;平台设计主要考虑可视化技术、沟通机制以及知识的结构化程度三个问题。
[关键词]知识提取 信息可视化 可视化技术
[分类号]TB18 G203
1 引言
可视化技术利用人类强大的视觉处理能力以及计算机这一自动化系统,将知识的外在表示方式与人类的视觉潜能紧密结合,极大地丰富了知识表示的方式,为知识提取提供了重要的途径。它主要体现在知识构建过程中,即利用可视化的方式将人脑中的知识表示出来,并经评价后存入知识库当中,以丰富知识存量、便于重复利用以及知识创新。基于可视化技术的知识提取是通过一定技术平台实现的,不同的任务环境具有不同的平台设计模式。此外,完成知识提取还需要一定的促进机制,如构建知识型团队、制定激励措施、推动技术应用等。
2 知识提取与可视化
知识提取是让知识主体告诉别人他所拥有的知识以及他的观点是如何形成的。知识提取是一个系统化的过程,是由一系列技术和方法组成的,这些技术和方法通过不同形式与知识主体进行交互、沟通及协作,来提取某一领域的知识(主要是隐性知识),形成知识库。基于可视化技术的知识提取是通过可视化技术丰富知识的表示方式,并使知识评价活动易于开展,进而完成知识的提取过程,旨在改善知识提取的效率与效果、增加知识存量以及提高知识库的质量。
国内外已经有一些学者从事了这方面的研究,也给出了一定的理论和方法。例如,在Noh等提出的隐性知识管理模型中,基于案例库,用推理的方法,通过描绘专家的认知地图来提取专家的隐性知识。其知识提取的具体过程是将专家解决问题的思维过程用图形表示出来,从中提取解决问题的方法,同时,将问题发生情境和条件等一起存入知识库,该过程被称为“有形化阶段”。当问题发生时,就可以从知识库中选择适应新情况的认知地图来解决新问题。另外,国内学者刘有源等也将可视化技术引入知识提取过程当中。他们认为,在建造智能CAD系统或设计型专家系统等基于知识的系统时,一个十分关键的问题就是充分提取领域专家的知识。由于领域专家的知识,尤其是经验性和直觉性知识通常很难提取,而这些知识又正是提高知识系统的问题求解能力所必须的,因此如果利用一组可视化对象将知识的内部表达与形式化表达联系起来,就能够帮助领域专家和知识工程师直观理解知识的表达和描述,从而提高知识提取的效率。
上述这些研究主要考虑的是可视化技术在专家系统中领域知识的提取,主要是将可视化技术与人工智能中的知识表示方法(例如,语义网络、框架表示法、Petri网、面向对象表示法等)相联系,对其他类型的知识工作者以及其它类型的知识关注不够;同时,利用的可视化技术比较单一,对各种可视化技术包括各种信息可视化和知识可视化技术的应用不够;也没有系统探讨可视化技术在知识提取中的应用,包括可视化技术如何支持知识提取,如何与其他技术及平台进行协作等问题。
3 基于可视化技术的知识提取实现框架
在充分吸收已有可视化技术在知识提取中的应用经验的基础上,结合知识提取过程本身的特点,本文给出如图1所示的基于可视化技术的知识提取实现框架。该框架将整个知识提取过程分为三个步骤:首先,将隐性知识以可视化的形式表示出来;然后,对知识的内容、结构以及可行性等方面进行评价;最后,根据评价结果形成最终的显性知识,存入知识库。其中,前两个步骤是知识构建的过程,最后一步是知识沉淀的过程。可视化技术对知识提取的支撑主要体现在知识构建上,同时也影响到知识库的构建。
图1中:①知识表示和知识评价之间是双向沟通关系,目的加强评价者和提出者之间的沟通,以避免误解,同时由于完成知识表示和知识评价常常有许多人参与,因此所有参与者之间也需要一个沟通机制作支撑;②为了让提出者更好地表示自己拥有的知识,同时让评价者能够尽快理解、掌握提出者的知识并对其做出评价,可视化平台的设计是关键所在,同时可视化技术与沟通机制之间可以相互补充,它们既可以是彼此独立的两个模块,也可以是互相嵌套的;③这里的知识库不再是狭义上的专家系统中的知识库或者规则,库,而是从整个组织的角度设计的知识库,是广义的知识库,其存储的知识形式也是多样的,可以是结构化的,也可以是半结构化的,甚至是非结构化的。
4 基于可视化技术的知识提取平台设计
4.1平台设计原则
4.1.1从任务情境出发 在不同的任务环境中,对知识提取平台的要求是有差别的。在以提取最大量的观点、想法或意见的任务情境中,例如利用头脑风暴法提取特定领域的核心概念时,知识构建倾向于利用简易的可视化技术表示知识,对知识的具体内容给予较少关注,而且对提取的知识也仅做少量评价或者表示完成后再评价;而在以提取高质量知识的任务情境中,例如在领域本体知识工程建立时,知识构建则倾向于利用丰富、规范的可视化技术表示知识,对知识的具体内容以及评价要求严格,知识的表示和评价通过一定的沟通机制不断反复进行。
4.1.2易于掌握和使用 为了保证让更多的人员能够在最短的时间内掌握平台的使用或者能够把握平台的特性,以有效完成知识的提取,平台的设计应遵循简单易用原则。
4.1.3丰富的交互功能 人机交互主要体现在局部细节与全局结构之间的切换以及各种动作选择两个方面。全局结构是指整个知识体系的映射方案,当知识体系的规模较小、能够在同一个屏幕上显示时,直接将所有局部细节按照一定顺序排列即可;而当知识体系达到一定规模,不能在同一屏幕上显示时,则需要提供相应机制。例如,概念图制作工具常常提供两种机制:一是将较大的概念图分割,并通过链接方式实现概念图之间的切换;二是提供导航地图,使用户能够迅速定位自己所浏览的位置。另外,还可以考虑多比例缩放机制、焦点+上下文机制、鱼眼视图来实现。动作选择是指为用户提供的操作功能,一方面便于表示知识;另一方面便于快速浏览、过滤和评价知识。不同的操作应采用不同机制来实现,包括按钮、面板、选项卡、滑块,鼠标操作、快捷键等。
4.1.4统一的集成平台 基于可视化技术的知识提取平台不仅需要可视化的知识构建工具,还需要一定的沟通机制,甚至需要与相应的知识库平台进行集成,以使用户不必在多个工具平台中频繁切换。
4.1.5一定的智能水平 基于可视化技术的知识提取平台处理的对象主要是知识,其智能也主要体现在 知识表示和知识评价方面。在知识的表示过程中,可以提供知识点记忆功能、高效检索功能、自动联想功能、错误提示功能、自动转换为知识库需要的格式等功能。而在知识评价方面,平台可以提供针对知识内容和结构的自动分析、统计、评价功能。例如,在本体构建工程中,可视化技术不仅可以支持本体的编辑、本体结构的直观展示,还可以支持一致性检查、本体演化等工作的完成。
4.2平台设计模式
不难发现,基于可视化技术的知识提取平台设计的重点在于可视化技术、沟通机制以及知识的结构化程度三个方面的把握。因此,本文提出了以可视化技术维、知识结构维以及沟通机制维的三维立体设计模式(见图2)。在不同的任务环境中,可以据此制定相应平台的具体设计方案。
基于可视化技术的知识提取平台设计主要从两个角度展开,即两种不同的设计策略:一是以可视化技术为主导,再考虑其他两个因素;二是以沟通机制为主导,进而选择可视化技术,再确定知识的存储策略。
以可视化技术为主导的设计策略首先关注如何利用相应的可视化技术去构建知识,在这种策略中,相应的构建功能是关键。例如,可以先使用微软的制图工具Visio,或概念图、思维导图制作工具Mindmanager、PersonalBrain等制图,然后将制作好的图形以网页的形式或者通过即时通信工具与他人在线交流,最终完成知识的评价。当然,也有一些工具本身也集成了沟通机制,例如,KeyoneStone允许多个用户协作共同编辑和制作同一幅概念图,不同用户之间可以通过其所提供的消息机制进行沟通。
以沟通机制为主导的设计策略则首先关注的是参与提取的相关人员通过什么样的方式进行沟通和交流,认为沟通机制直接决定知识提取的效果。例如,可视化Wiki编辑器――WikiMindMap,以Wiki作为沟通工具,并结合思维导图来提取知识。
4.3平台设计实例分析
基于可视化技术的知识提取与任务情境密切相关,本文下面结合Ideaquarium设计实例,来详细分析基于可视化技术的知识提取平台的设计模式和方法。
Ideaquarium是利用视觉隐喻技术及头脑风暴法提取知识的平台。图3是电信运营商利用Ideaquarium制定网络服务广告战略的情景:
制定战略的过程分为三步:①根据目前的形势界定战略的出发点并将其映射为贝壳,还可以给出战略的思考方向并将其映射为石头;②参与人员提出自己的想法并将其映射为一条想法鱼(idea fish),根据不同的思考方向将其放在不同的位置(不同石头的上方),这一过程中参与者之间需要进行沟通,以保证彼此能够正确理解他人的想法并给出初步评价,想法鱼的尺寸代表相应的支持度,越大表示支持者越多;③参与人员对提出的所有想法鱼分类,制定评价标准并将其映射为标准鱼(criteria fish),然后将所有的想法鱼与标准鱼进行比较,根据达到标准的程度,按高低排列所有的想法鱼,越高表示越接近标准,而那些高出标准鱼的想法鱼即是有效的想法,通过这些想法即可制定最后的广告战略。
Ideaquarium让专家能够时刻把握提取过程的全貌,同时对别人及自己的想法有更好的认识,便于及时进行调整,提取过程中也易于激发新的思路和方法。视觉隐喻的应用使得知识提取的过程直观、形象且更易提取新的知识。
Ideaquarium能够完成大量观点的提取,但是该平台也存在以下缺陷:①对想法的内容本身及其关系揭示不够,它仅将想法的内容用一句话或一条短语表示,而且对各个想法之间的关系仅做了简单分类;②能够隐喻的想法数量十分有限,如图3中想法鱼仅有10条,想法的具体内容显示得不够清晰。
5 结语
有效完成知识提取工作还需要良好的外部环境的支持。通过建立一定的促进机制,可以帮助知识提取顺利完成。这些机制主要包括创建知识型团队、制定促进知识提取的各种激励措施以及推动包括可视化技术在内的各类信息技术的广泛应用等。
基于可视化技术的知识提取的完成需要利用一系列的信息技术(包括各种可视化技术、沟通工具、智能处理设备),而掌握和使用这些技术是需要花费一定时间和精力的。因此,首先就要把基于可视化技术的知识提取平台设计得简单易用,便于相关人员掌握和使用,同时让相关人员认识到可视化技术的价值(如为什么要利用可视化技术,可视化技术对工作及任务的完成有哪些益处等),这样才能取得满意的推广效果。在目前的情况下,全面推动基于可视化技术的知识提取的应用还不成熟,但可以在特定领域、在组织的特定任务环境中率先尝试应用。
相关热词搜索:可视化 提取 知识 基于可视化技术的知识提取研究 可视化分析技术研究 可视化数据分析
热点文章阅读