刊文精选

大数据时代经管类统计学面临的挑战与变革

来源:教育教学论坛     2018-11-29 16:58:01      点击:
大数据时代经管类统计学面临的挑战与变革
李宾,周俊
湖南科技大学商学院,湖南湘潭411201
 
摘要:随着大数据时代的到来,数据从获取的途径、特征到分析方法,都发生或正在发生巨大的变化。经管类本科统计学作为学习数量分析的传统基础课程,也急需进行相应的变革。本文基于经管类统计学课程的培养目标,从统计学的定义出发,展示了大数据时代统计学面临的挑战,分析了传统统计学教学内容和教学模式存在的问题,进一步提出了课程教学内容改革和教学模式改革的思路。
关键词:大数据,统计学,挑战,变革     教育教学论坛
The Challenge and Reform of Economic Management Statistics in big data era
 
Li Bin, Zhou Jun
 
Business School, Hunan University of Science and Technology, Xiangtan 411201, Hunan
 
Absrtact: with the arrival of big data era, great changes have taken place or are taking place in data acquisition, characteristics and analysis methods. As a traditional basic course of quantitative analysis, economics and management undergraduate statistics also needs to be reformed. Based on the training goal of the course of economics and management statistics, this paper, from the definition of statistics, shows the challenges faced by statistics in the era of big data, and analyzes the problems existing in the traditional teaching content and teaching mode of statistics. Further, the reform of teaching content and the reform of teaching mode are put forward.
 
Keywords: big data, Statistics, challenges, change
中图分类号:C829. 29
 
1引言
统计学是一门科学地搜集、处理、分析和解释数据的学科[1]。统计分析的目的在于挖掘大量社会经济现象背后隐藏的数量特征和联系,揭示客观现象的一般规律性,进而对相关社会经济问题做出经验判断和预测。经管类统计学课程旨在培养具有较厚实的统计学基础,掌握必要的统计分析方法和数量分析技能,具有较熟练应用计算机处理和分析数据的能力的创新应用型人才。一方面,随着人与信息互动的Web2.0时代进入到人与知识互动的大数据时代,数据的特征也发生了翻天覆地的变化。具有5V(Volume、Velocity、Variety、Value、Veracity)特点的大数据的流通和使用,必然成为一种新的生产要素,极大提升经济社会的效率。
2大数据时代经管类统计学面临的挑战
2.1数据的搜集方式的变化
一方面,数据来源极其大量丰富。互联网时代的信息联系密切通畅,数据直接来源遍及个体和社会经济活动的方方面面;且随着大量专业统计数据库的建立,间接数据来源也更加丰富。另一方面,数据的收集和获取手段快速高效。网络时代搜索工具及数据挖掘软件的广泛开发,原本在非网络时代很难收集和使用的数据开始容易被利用起来,网络手段弥补了传统的抽样调查和普查之间的不足,时效性极大提高,数据更新迅速稳定。
2.2  数据类型的变化
首先,数据类型由结构化数据向半结构、非结构数据的转变。而其中非结构化数据所占比例将越来越多。其二,数据由低频低维数据向高纬高频数据的转变。海量的高频高维半结构化数据交错复杂,既隐藏着丰富的价值,也模糊了数据背后的逻辑特征。这对从信息中提取关键信息要素,挖掘数据背后的逻辑机理,增加了难度。
2.3  数据处理和分析方法的转变
根据维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》,大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。这需要更高效迅捷的统计分析工具,具有对海量数据的挖掘能力、处理能力,以及对搜索行为的分析能力等。区别于传统的抽样推断理论,借助云计算的大数据的分析方法正在发生重大变革。从某种程度上来讲,大数据考验的并不是统计学的方法论,而是计算机科学技术和算法的适应性。
3  经管类统计学课程传统教学内容和模式的不足
3.1  教学内容的滞后
首先,在数据的收集阶段,现有统计学教材鲜有涉及大数据内容,也几乎没有介绍网络数据采集和挖掘,还停留在传统的抽样调查阶段;学生也不了解有哪些专业的大数据资源可以作为间接来源。其次,缺少对半结构、非结构数据进行质量分析和清洗过滤知识的系统介绍;其三,统计描述分析部分极少有介绍不同问题背景下数据的处理和筛选;统计推断部分也多是以简单低维数据的正态性特征作为先验假设,但充分多的经验证明,对巨量的非实验性的社会经济类数据,继续直接套用先验假设的分析失去了合理性,同时也严重损失了数据信息和分析效率。
3.2  教学模式的碎片化
教学模式的碎片化一方面表现在,在原理性教学环节,虽然针对每个知识组块都有采取案例教学方式,案例之间却是互不相关的;另一方面表现在,知识点的介绍忽略了数据的现实问题背景。这种碎片化模式给人的感觉是内容琐碎而不系统,这样的处理固然能易于理解单个知识点的数学原理,却割裂了统计分析方法背后所隐含的前后逻辑性。碎片化问题体现在统计学实训教学环节上,第一,实训内容不能与实际问题相结合;学生只会按部就班进行单个知识点验证性的实验操作和解读,不善于主动发现问题,也不会熟练利用数据库资源搜集相关数据。第二,分析能力的欠缺;操作只停留在窗口工具条阶段,不会针对具体问题运用软件进行数据的灵活处理和个性开发。碎片化模式不利于学生发现社会实践问题背后的数量逻辑和挖掘数据内在规律。因此,经管类统计学应培养学生对知识的应用性和开拓性,才有可能在大数据时代,培养出有创新意识和能力的综合应用型人才。
4.经管类统计学课程教学的改革思路
4.1 教学内容的调整
统计学内容调整的总体思路是,将传统统计分析扩充到一般化的数据处理。这样做可以在本科传统统计学和大数据分析之间形成一个有效链接。具体来说可包含以下几个方面:
4.1.1  补充计算机算法和探索性程序开发的基础知识
经管类本科生如果能掌握一定的计算机技术和程序开发技能,熟悉数据抓取和挖掘技法,将在大数据分析时代占有先机。统计学课程前期,可以适度掌握一定的Python或C++语言等相关程序语言,了解或自主开发数据采集的爬虫程序;同时在统计软件实训阶段,可以学习更高效更灵活的数据处理的软件,比如R等,开发和提高数据挖掘和综合分析的能力。
4.1.2  注重数据质量和数据清洗的相关内容
数据质量包括完整性、准确性、一致性等几个方面,只有高质量的数据才能挖掘出真正隐藏的信息,数据清洗是进一步数据处理的基础。如何“洗”掉“脏”的数据,纠错补缺、规格统一、逻辑修正以及转换,筛选平滑,异常值处理等等,需要更广泛的知识,从统计学的角度看,数据预处理和转换的重要性显著增加了。
4.1.3  重视多元统计和贝叶斯统计分析方法
基于数据的多元多层次和高维高频特点,变量间的关联性也变得更加复杂,数据分析离不开数据和变量的降维等分析方法。建议本科经管类统计学教材适度增加聚类、判别、主成分和因子分析等多元统计内容,以及关联分析和路径分析等方法。其次,作为与大数据分析相联系的机器学习的核心方法,贝叶斯统计分析应成为统计学的基本内容。
4.2  教学模式的变革
改碎片式的教学模式为问题导向的进程式教学模式。问题导向的进程式教学模式基于一个典型的社会经济问题,从数据采集到统计分析,让案例贯穿整个教学进程。通过这样的方式,学习如何针对具体问题搜集数据、处理数据和研究数据,以及如何综合数据信息来解读所隐含的现实逻辑。
 
 
 
 
图1 问题导向的进程式教学模式
与理论教学相联系,实训教学部分也改验证性模式为探索性自主研究模式。一方面以实际社会经济问题的数据分析为训练内容;另一方面,以探索性自主研究为考核重点,让学生以个人或者小组形式自主选择具体的社会经济问题为研究课题,与传统的统计调研相结合,充分利用国内国际的权威统计数据库资源采集数据信息,进行探索性研究,培养学生的统计创新能力。
 
5  本文小结
本文基于经管类统计学课程的培养要求和大数据发展的现实背景,分析了当前经管类统计学面临的挑战和统计学课程教学内容和教学模式的不足,提出了经管类统计学课程教学的改革思路。本文认为,在大数据背景下,经管类统计学教学应该与大数据发展接轨,适度调整相应教学内容;并采取问题导向的进程式教学模式,紧扣现实社会问题,在本科阶段初步训练和培养能顺应大数据时代的经管类创新应用型人才。
 
 
参考文献
[1] 贾俊平,何晓群,金勇进.统计学(第六版)[M].中国人民大学出版社,2015.
[2] 朱建平,张悦涵. 大数据时代对传统统计学变革的思考[J].统计研究,2016(02).
[3] 程园园. 大数据时代大数据思维与统计思维的融合[J].中国统计,2018(1).
作者:李宾(1972-),男,湖南湘阴人,博士副教授,主要研究领域是经济增长理论、数量经济学和实验经济学。
基金项目:校级教学改革项目《融合实验经济学的博弈论实践教学探索》。
 
收稿日期:2018-7-23


本文版权归教育教学论坛杂志社及本文作者所有,未经同意,不得转载! ——《教育教学论坛》查稿电话:0311-85178286