基于Hadoop的中医药大数据平台基础架构的设计与研究

发布时间:2018-06-23 来源: 日记大全 点击:


  [摘要] 大数据技术在当下被广泛关注,构建中医药大数据平台是未来强化中医药行业竞争力的有力武器。本文通过解析中医药大数据特性,设计和研究中医药大数据平台的基础架构,通过合理设计和部署集群、网络和服务器等环境,力求提供稳定可靠的中医药大数据基础平台环境。
  [关键字] Hadoop;大数据平台;中医药;基础架构
  [中图分类号] R2-05 [文献标识码] A [文章编号] 1673-7210(2018)02(c)-0158-05
  Design and research of traditional Chinese medicine big data platform infrastructure based on Hadoop
  WANG Li WANG Ping SHEN Junhui
  Information Center, Beijing University of Chinese Medicine, Beijing 100029, China
  [Abstract] Big data technology has been widely concerned in the present and building a big data platform for traditional Chinese medicine is a powerful weapon to strengthen the competitiveness of traditional Chinese medicine in the future. In this paper, through the analysis of traditional Chinese medicine data characteristics, architecture design and research of traditional Chinese medicine data platform, through reasonable design and deployment of cluster, server and network environment, so as to provide a stable and reliable traditional Chinese medicine data base platform.
  [Key words] Hadoop; Big data; Traditional Chinese medicine; Infrastructure
  在當今社会,信息技术与经济社会的交汇融合已近引发了数据迅猛增长,数据已成为国家基础性战略资源。2015年8月31日,国务院印发《促进大数据发展行动纲要》(以下简称《纲要》),系统部署大数据发展工作[1]。《纲要》明确指出,推动大数据发展和应用,在未来5~10年打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。坚持创新驱动发展,加快大数据部署,深化大数据应用,已成为稳增长、促改革、调结构、惠民生和推动政府治理能力现代化的内在需要和必然选择。
  近几年,中医药医疗行业的数据增长迅猛,中医药医疗行业也应抓住契机紧跟时代的步伐,大力发展信息化建设。2015年,国务院公布的《中医药健康服务发展规划(2015-2020)》,特别提到了运用云计算、移动互联网、物联网等信息技术开发智能化中医健康服务产品[2]。2016年2月22日,国务院发布了《中医药发展战略规划纲要(2016-2030年)》,其中明确了未来十五年我国中医药发展方向和工作重点,以及今后一个时期中医药发展的重点任务。《中医药健康服务发展规划(2015-2020)》中明确指出推动“互联网+”中医医疗作为重点任务之一,将推进中医药信息化建设作为完成重点任务的保障举措[3]。在推进中医药信息化建设的保障举措中要求按照健康医疗大数据应用工作部署,在健康中国云服务计划中,加强中医药大数据应用。在若干政策的大力支持下,大数据技术与中医药医疗行业相结合,必将产生巨大的经济和社会效益。
  1 行业背景
  目前在学术界和产业界对于大数据(Big data)并没有一个严格的定义[4]。研究机构Gartner定义“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。麦肯锡全球研究所对大数据给出的定义是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征[5]。而对于大数据的特征也是众说纷纭,基本上容量、种类和速度是大数据公认的3个基本特征[6-8]。
  在中医药医疗行业领域中,中医药信息具有非常典型的大数据特征。首先从数据量上看,北京的一所三甲中医医院平均1 d的门诊量可达1万人次,每年住院患者可达5万以上,如果将这些患者的诊疗过程全部数据化,每人次就诊产生的医学数据以10 M计,那么每年产生的数据量将高达70 TB,如果把全国中医院的临床数据都汇聚起来,其规模之大可想而知。其次,数据类型复杂。在中医医院,每个患者不但要经过辨证论治的个体化诊疗,还会经过各种检查检测进行疾病及其预后诊断,所以不光有病历资料中包含的信息,还包括检查、多种影像或病理切片检查的生物学信息。这些众多类别的数据通过分析处理可以产生多种多样的数据存储形式。再者,在数据的时效性方面,医疗数据每时每刻都在产生,例如临床诊断等都具有实时处理的需求,具有时效性。
  但是目前绝大多数中医药医疗行业数据均处于归档状态,使用传统关系型数据库技术使得数据的存储、数据结构扩展、数据分析和检索都无法发挥数据的真正的价值,数据的价值和利用率受到了严重制约,大数据技术的引入将很好的解决这些问题,并为使用者带来超乎预期的数据服务。

相关热词搜索:中医药 架构 基础 数据 研究

版权所有 蒲公英文摘 www.zhaoqt.net