当前位置: 首页» 学术前沿

 

相关文章

热门文章

赵映川:大数据时代院校研究的发展与突破

来源:《高校教育管理》2014年第1期   日期:2014-03-12


  2013年7月14-16日,“院校研究:数据分析的对象,内容和方法”研讨会暨2013年中国院校研究会年会在昆明召开,来自全国160余所高校的257名代表及14位专家学者参加了会议。回忆围绕我国院校研究数据化的时代背景,具体技术和方法问题进行了探讨,通过交流,与会者对大数据时代我国院校研究发展的新思路和新方法达成了共识。本次研究会主题鲜明、内容丰富、观点前沿,对我国院校研究必将产生深远的影响。
  一、数据化院校研究的背景:大数据时代
  今天,数据已经无所不在,我们的衣食住行、喜怒哀乐、吃喝玩乐都以数据的形式存在。通过网络和软件,我们用数据来记录这个世界,再通过研究数据去发现这个世界。因此,大数据将是下一个社会发展阶段的“石油”和“金矿”,无论是个人,企业还是国家,谁能更好的抓住数据、理解数据、分析数据,谁就能在下一波的社会竞争中脱颖而出。那么,大数据对院校研究带来了什么样的影响呢?
  华中科技大学教科院张俊超副教授从宏观曾面分析了大数据对人们思维方式的影响。她指出大数据时代的特征:一是数据更大。在小数据时代,由于计算工具的限制,通常使用抽样调查的方法获得较少的数据;而在大数据时代,借助先进的计算机技术,可以获得研究对象的总体数据。二是数据更复杂。在小数据时代,数据多是结构性的,即关系型数据—由二维表及其之间的联系组成的一个数据组织。而在大数据时代,一些不可计量、存储、分析和共享的很多东西都可以被数据化而形成非结构化数据,如图像、声音、影视、超媒体等。三是数据更好。在过去的研究中,人们往往注重分析数据之间的因果关系,但由于数据很难揭示出事物之间的因果关系,因而数据的价值没有得到充分的发挥。大数据时代,通过数据挖掘等技术,可以为人们展现从未想过的因果关系,为决策提供依据。大数据时代的这些特点促使人们的思维方式发生了以下改变:首先要学会用数据“说话”。有学者认为我国没有从农业社会成功地转型为商业社会,根本原因在于缺乏以数据为基础的数字管理。其实,我国并不缺乏可供收集的数据,也不缺乏收集数据的手段,而是缺少收集数据的意识。因此,当务之急是形成用数据说话的意识,养成用数据说话的习惯。其次,接受数据的纷繁复杂,而不是限于精确性。大数据时代,许多以前不可估量、存储、分析和共享的东西都可以被数据化,如各种关系(交友网络)可以数据化,各种情感可以数据化(博客),因此,数据可谓浩如烟海、形式多样。最后,由执着探求因果关系转而关注事物的相关联系。由于大数据可以揭示事物之间大量的、人们从未想过的相关关系,为经济、文化和政治决策提供较好的依据,因此,大数据时代开启了一场寻宝游戏,人们对于数据的看法以及对于因果关系向相关关系转化时是释放出的潜在价值的态度,正是主宰这场游戏的关键。
  厦门大学教育研究院别郭荣教授从中观层面分析了院校研究中数据分析的价值。他指出:当前许多校长在决策的过程中,常常根据上级的指令、过去的经验、主观的判断行事。但是,随着我国高等教育管理体制的改革,以往通过检查工作、发布指令等控制高等教育的方式正在改变。2013年7月13日,教育部召开了专题会议,探讨对高校的简政放权,即校长将获得更多的办学自主权,同时也意味着他们将进行更多的自主决策。与此同时,根据《国家中长期教育改革和发展规划纲要(2010—2020)》,我国高等教育今后发展的重点是提高办学水平和质量。如何提高,绝不能仅凭校长个人的经验进行管理,也不能仅凭校长的怕“拍脑袋”进行决策,而必须在充分调研和大量数据的基础上做出科学的决策。数据如何在学校发展中发挥作用,学校如何运用数据进行科学管理,别教授通过其为一些高校做的战略发展咨询报告进行了详细讲解。
  清华大学教育研究院史静寰教授从微观层面阐述了“科学采集和分析数据是院校改进的坚实基础”。她首先对MOOC(大规模开放网络课程)时代的我国高等教育发出了振聩发聋的诘问:目前,在Coursera上注册的1600万学生中,中国学员只占4%,位居第三,排名第一、第二的是巴西和印度。可以预测,10年后的印度有上亿人是哈佛、麻省理工、斯坦福等世界名校用研讨式的翻转课堂方式培养出来的毕业生,而我们的下一代还在传统的高考及一大批庸师庸校中混文凭,世界名族之林还容得下我们这棵树吗?因此,2013年5月21日,清华大学、北京大学正式宣布加入edX;7月9日,上海交通大学等高校宣布加入Coursera。然后她以“中国大学生学习与发展追踪研究”项目为例,介绍了在院校研究中如何通过抽样调查获得数据,如何对数据进行科学的分析,如何根据质性数据的分析结果开展质性研究,如何将质性分析结果与定量研究结果结合进行分析等问题。
  二、数据化院校研究的内容和方法
  我国已有一些高校开始借助数据化进行院校研究,并取得了可喜的成绩。大会10余位发言者介绍了各自院校数据化研究的情况。
  (一)数据化院校研究涉及的内容和特点
  中国地质大学(武汉)的侯志军通过两个实践案例指出我国院校研究的内容具有“三多三少”的特点,即一是从院校研究的数量来看,完成外部压力驱动的研究多,开展内部改动驱动的研究少;二是从校领导决策需求来看,按照政府要求完成研究的需求多,敢于根据学校发展需求提出并开展研究的需求少;三是从高校研究人员及其研究质量来看,能够完成内部要求撰写研究报告和公文类的院校研究办公室多,能够运用科学方法全面研究学校发展并推动学校改革的院校研究办公室少。
  上海财经大学的郑策介绍了该校以学科信息平台为抓手,提升院校科学决策水平的做法。在内外推力的驱动下,上海财经大学建设了学科信息平台,通过整合校院两级管理体系下相对分散的学科信息以及深度挖掘和整合学科数据,为学院各项事业的发展提供了科学依据,实现了学科资源的合理配置,建设了国家级重点项目,完善了校务决策支持系统。
  中山大学的屈琼斐作了“院校研究数据的收集与利用—中山大学学生学习调查实践”的报告。为了了解学生学习状况,在借鉴美国各种比较成熟的学生问卷基础上,结合研究型大学的实际情况,中山大学研发了一套涵盖大学生学习经济各个环节和层面的题库。2012年5—6月,对全校3.3万名本科生进行了在线测试,所得结果为《本科教学质量报告》提供了必要的数据支持,为学校春、夏季战略研讨会提供了重要的数据支撑,为各院系改善工作提供了可靠的数据依据。
  相比上面3所高校的研究内容,以下的研究更为微观。
  为了了解本科生学习性投入情况,云南大学采用汉化后的“全美大学生学习性投入调查(NSSE)”和“中国大学生学习与发展追踪研究(NSSE—China)”问卷,抽样选取1600名本科生进行调查。结果显示,来自城市。特别是来自地级市的大四(即将毕业但还在校的)文史哲学科的党员或提交过入党申请书的女生在学校的表现更加积极、上进,思想开放,善于与人交往,乐于与他人合作,并且成绩好、综合素质高。这一结论对学校有针对性地提高学生的学习性投入具有很强的指导意义。
  桂林电子科技大学通过对大学英语四级考试数据的挖掘,发现工科学生的大学英语课程成绩对其大学英语四级通过率的影响最大,毕业设计成绩、高等数学课成绩、专业基础必修课成绩也会影响大学英语四级考试的通过率。根据这个研究结论,学校应引导大学生有选择地通过英语四级考试或者采取针对性措施通过英语四级考试。
  温州医科大学则通过学生学习成绩的比较分析,探讨学习课程教学的有效性。通过分析,该校的人文通识课程与在校课程成绩的关联性不明显,即课程有效性低。心理科目成绩出现负相关,公共知识科目的课程成绩与国家执业医师考试成绩间差距显著小于其他模块,专业知识模块与在校期间的成绩有显著相关关系,教学有效性高。根据此项研究成果,该校进行了如下改革:有重点地引进社会科学学科带头人及团队,提高社会科学绩效水平;修订人才培养方案,加强行为科学、社会科学等课程教学。
  (二)院校研究数据化的方法
  数据的价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而绝大部分则隐藏在表面之下,需要借助一定的方法进行挖掘。与会者介绍了目前院校研究中常用的几种方法:
  张俊超介绍了美国院校研究中常用的4种方法:一是多层次、多角度的数据报表及在线分析处理(Drill-down data report and OLAP),它可以使用户更容易根据不同的需求对数据有选择地进行抽取和浏览,更加直观、灵活地从多层次、多角度对数据进行展示,也使得对各方面数据进行综合报告更加容易和快捷。二是仪表盘技术,它通过与汽车油表类似的图形,向用户形象地展现数据分析的结果,让决策者一目了然地了解运行基本状态,得到决策者所需要的重要和关键信息。三是数据挖掘,它通过分析每个数据,从大量数据中寻找其规律,主要有数据准备、规律寻找和规律表示3个步骤。通过数据挖掘可以找到未知的新关系,发现新模式,寻求未来发展之道。四是商业只能,是指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。确切来讲,商业只能并不是一项新技术,而是将数据仓库、线上分析处理、数据挖掘等技术与资源管理系统结合起来应用于商业活动实际过程中,以达到技术服务于决策的目的。
  桂林电子科技大学在研究那些课程影响学生英语四级考试成绩时,采用了数据挖掘技术。分析所用的数据有:学号、大学英语课程平均成绩、高等数学平均成绩、基础必修课平均成绩(不包括高等数学)、专业基础必修课平均成绩、毕业设计课程成绩•大学英语四级考试成绩;分析采用了决策数进行预测。
  华中科技大学教科院的陈敏教授采用社会网络分析法对其所在高校的远缘跨学科研究现状进行了分析。其研究假设大学是由若干院(系)——网络图中的结点及其它们之间的关系组成的网络,以跨学科学者合作论文作为开展跨学科研究的标志,以2000—2012年中国知网中国学术文献网络出版总库(CNKI)数据为数据源,以清华大学、北京大学、复旦大学、浙江大学、上海交通大学和武汉大学作为参考系,采用社会网络分析法,利用Ucinet等分析软件计算合作论文网络密度和合作院系相对中心度,探讨华中科技大学远缘跨学科研究存在的问题。
  三、院校研究数据化需要注意的问题
  美国伊利诺伊州立大学林曾教授针对前面专家学者的发言提出了我国院校研究中需要注意的几点:一是大数据小数据是相对的,没有一个绝对的标准可以把数据划分为大数据和小数据,某一数据相对一个标准是大数据相对另一标准是小数据。二是大数据可以解决问题,小数据同样不可或缺。在大数据时代,院校研究应该尽可能多地收集数据,全面地反映事物的整体面貌。但这并不意味着可以忽略小数据的价值,在某些研究中,小数据的价值不可替代。三是研究中既要挖掘相关关系,也要探寻因果关系。相关关系揭示的是两个变量之间的相对关系,因果关系揭示的是客观世界中普遍联系着的事物之间先后相继、彼此制约的关系。这两种关系在院校研究中缺一不可。
  会议还设置了对话和提问环节,苏州大学的周川教授、华中科技大学的赵炬明教授和张俊超副教授、美国伊利诺伊州立大学林曾教授、中国地质大学(武汉)的侯志军等专家与参会者就一些问题展开了热烈的讨论。如有参会者提问院校研究是否有自己独特的研究方法,专家认为:现阶段,院校研究根据研究的问题而采用不同的方法,它本身并没有形成自己特有的研究方法。还有擦汗你会这对院校研究人员的身份认同、在学校决策中的作用感到困惑,专家通过在美国院校研究中的亲身体会给予了回答:院校研究人员只向领导提供数据分析的结果以及可能选择的解决方案,他们的工作到此结束。领导最后做出何种决策,院校研究人员无需也无权参与。院校研究人员在研究中要保持中立、客观,一切凭数据说话。另外,他们必须提高收集数据、分析数据的能力,尽量提出切实可行的解决方案。当学校决策越来越离不开院校研究工作时,院校研究人员将获得期望的认同感。

  注释:
  ① edX是麻省理工和哈佛大学于2012年5月联手发布的一个网络在线教学计划
  ② Coursera是负责大型公开在线课程项目,由美国斯坦福大学两名电脑科学教授安德鲁•格恩和达鞭妮•科勒创办
 


上一篇:
下一篇: