大数据可用性在高等教育领域的重要性研究

发布时间:2019-08-11 来源: 人生感悟 点击:


  摘要:随着信息技术的飞速发展,各种数据增长十分迅速,数据量大到无法通过常规的方法进行分析处理,大数据应运而生,大数据在各领域应用广泛,在高等教育领域亦是如此。高校的信息系统是数据生产大户,但高校的数据价值密度却很低,文章主要介绍了大数据给高校带来的影响,指出了高校中存在的大数据可用性问题,并提出了从关系数据一致性和实体同一性两个方面提高高校数据可用性,帮助高校从海量数据信息中提取有效数据,相对提高数据的价值密度。
  关键词:大数据;数据价值密度;数据可用性;数据一致性;实体同一性
  中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)13-0020-02
  Research on the Importance of Large Data Availability in the Field of Higher Education
  HAN Xiao-xiang 1, XU Hua-zhen 2, WEI Li-hua 2
  (1. Nantong Institute of Technology, Informatization Construction Management Office, Nantong 226002,China;2. Nantong Institute of Technology, School of Computer And Information Engineering, Nantong 226002,China)
  Abstract: With the rapid development of information technology, all kinds of data grow very fast, and the amount of data is too large to be processed by conventional methods. Big data emerges and it is widely applied in various fields, and also in higher education. The information system of university is a big data producer, but the density of data value of university is very low. This paper mainly introduces the influence brought by big data to universities, points out the availability of big data in Colleges and universities, and puts forward methods of improving data availability from two aspects: consistency of relational data and entity identity, in order to help colleges and universities to extract effective data from massive data information, and to improve value density.
  Key words: big data; data value density; data availability; data consistency; entity identity
  大数据是指无法在可承受的时间范围内用常规的软件工具进行捕捉、管理和处理的数据集合,是需要采用新处理模式才能获取很多智能的、深入的、有价值的信息,以期得到更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资源[1]。目前,大家比较公认的是大数据具有4V的特点:数据规模大,即数据量大,数量级别从TB跃升到PB,不久将会产生EB级别甚至ZB更高级别的数据;数据种类多,数据类型不仅包括传统的关系结构化类型,还包括半结构化和非结构化类型;处理速度快,数据产生和更新的频率快,要求处理数据的速度更快;价值密度低,数据海量增长,但获取到的有用信息难度也不断加大[2]。
  1 高校中的大数据
  大数据现已提升到国家战略层面,“十三五”规划明确提出要大力发展大数据产业,加快建设数据强国,实现我国从数据大国向数据强国转变。大数据正推动着各行业的发展。高校作为教育机构,它不仅能够利用信息化技术发展教育,还对信息时代的发展起到促进作用[3]。高校也是数据生产大户,高校的工作从宏观上可划分为教学、科研、管理三大类,从教学上看,会产生学生作业数据,学生学习成绩数据,教师备课教案数据,教师备课数据等;从科研上,会产生教师科研方面的数据;从管理上,会产生学生基本信息数据,教师基本信息数据,其他崗位工作人员基本信息数据,学校基本信息数据,学生各项评比数据等等。高校中产生的这些数据具有数量大、种类多、产生快、真实可信和具备分析价值等特点,完全符合大数据的特征。研究这些数据,对于高校建设与发展有着重要的意义。比如大数据可以预测学生是否能顺利完成课业,纽约州波基普西市玛丽斯特学院(Marist College)与运营数据分析公司Pentaho合作发起开源学术分析计划(The Open Academic Analytics Initiative),旨在一门新课程开始的两周内预测哪些学生可能会无法顺利完成课程。通过收集分析学生的学习习惯—例如点击线上阅读材料、是否在网上论坛中发言、完成作业的时长——来预测学生的学业情况、及时干预帮助问题学生,从而提升毕业率。再比如大数据可以发现被关注的学生对象,电子科大曾做过一个课题—寻找校园中最孤独的人。他们从3万名在校生中,采集到了2亿多条行为数据,数据来自学生选课记录、进出图书馆、寝室,以及食堂用餐、超市购物等数据。通过对不同的校园一卡通“一前一后刷卡”的记录进行分析,可以发现一个学生在学校有多少亲密朋友,比如恋人、闺蜜。最后,他们找到了800多个校园中最孤独的同学,这些同学平均在校两年半时间,一个知心朋友都没有。这些人中的17%可能产生心理疾病,剩下的则可能用意志力暂时战胜了症状,这些同学就需要学校和家长重点予以关爱。高校中大数据应用广泛,但也存在一定的问题,后面将做着重分析。

相关热词搜索:可用性 高等教育 重要性 领域 数据

版权所有 蒲公英文摘 www.zhaoqt.net