中国心理学家网
 
热线咨询 0551—2826223
当前位置: 网站首页 - 心理学论文 - 应用类
    发表日期:2016年5月15日 作者:李晶 俞国良 编辑:shphao 有1405位读者读过此文 【字体:
大数据视野下的心理学研究变革

2011 年起,大数据成为社会上学术界炙手可热的话题,媒体网络街头巷尾,处处可见对这一新词汇的相关报道随着其应用的推广,经济金融管理科技制造等诸多产业均发生着革命性的改变大数据技术大数据工程大数据科学和大数据应用等诸多领域如同雨后春笋般应运而生; 而推陈出新的数据挖掘技术,则令大数据如虎添翼,不断冲击着传统的学术研究范式,为传统科学研究提供了全新的研究工具

在心理学与教育学领域,大数据方法已帮助研究者取得了一定成果德国波恩大学的马科维茨·亚历山大( Markowetz Alexander) 等人介绍了使用智能手机记录和分析操作者行为研究,对重度抑郁症患者的动态跟踪研究; 韩国心理健康研究中心的宋泰民( Song Tae Min) 等人研究了韩国人2004 2010 年间在谷歌搜索引擎中关于自杀压力饮酒等关键词汇的搜索频率,并与实际自杀人数建立多水平模型,验证了压力自杀等词汇的搜索频率与自杀人数的正向相关关系; 默瑟通和耶瑟夫( Merceron andYacef)利用相关规则数据挖掘方法,对不同学生在学习与考试过程中的相似错误进行分析,从而提出改进教学方法的建议; 麦菲顿和道森( Macfaydenand Dawson)分析学生参与在线课程的行为,利用参与讨论的程度邮件频率完成测验数量等变量,区分优秀学生与不良学生之间的差别在大数据时代,将心理学与教育学共同研究具有如下意义: 第一,心理学是研究人类的心理现象精神功能和行为的科学,教育学是研究教育现象及其规律的社会科学,而教育的主体是学生或教师,即人是教育的出发点由此可见,心理学与教育学的研究主体是一致的,二者在大数据相关研究中所需的数据类型研究方法等具有一致性第二,在教育学的研究过程中,制定教育目标教育原则,选择教育方法组织教学等方面,都需要心理学知识作为依据,这在使用大数据作为研究工具时也是必要的第三,心理学研究也需要教育学理论与实践的支撑一方面,教育学的大量研究成果是学生在学习过程中规律的总结,这直接丰富了心理学领域的相关内容;另一方面,教育学研究以学生和教师作为研究对象,这个研究对象本身拥有巨大的体量,符合大数据研究的基本要求,也为心理学研究提供了丰富的素材

传统的心理学与教育学定量研究,是以假设检验的方法为主要研究过程的在此过程中,首先提出假设,对变量进行控制,通过观察实验访谈等搜集数据,之后对资料进行分析并推断出相关结论该方法的缺点之一是,假设检验是以排除不正确假设为基础的,但是为了得到正确的推论,还要继续进行新的假设而与传统研究方法不同,大数据则根据获取到的数据特征,首先通过相关分类聚类可视化等方法对数据进行先期处理,从处理的结果中分析可能的原因,从而做出推断这种近似反向的研究思路,正是大数据视角下心理学与教育学研究范式的重要特点

心理学与教育学的大数据类型

摩尔定律认为,当价格不变时,同一个面积集成电路上可容纳的晶体管数目,每隔18 24 个月便会增加一倍换言之,计算机硬件的处理速度和存储能力,每18 24 个月也将提升一倍这有力地推动了全世界对物理存储器的消费,推动了数据量存储呈几何级数的增长国际著名咨询机构高德纳咨询公司( Gartner) 预测,到2020 年,世界上存储的数据总量将达到35ZB,相当于80 亿块4TB 的移动硬盘海量的数据存储量是大数据时代科学研究的前提条件

与其他领域相同,心理与教育领域的大数据主要包括三种类型: 结构化数据非结构化数据与半结构化数据结构化数据是以往研究的重点,而非结构化数据和半结构化数据的数据量远远大于结构化数据,是未来研究的重点,具有更大的开发潜能

( ) 结构化数据

结构化数据即数据库数据它是存储在数据库里,可以用二维表结构来表达实现的数据,如数字符号图表等信息显然,传统的心理领域与教育领域的研究更多的是面向这些结构化数据结构化数据有三种类型,即截面数据纵向数据和面板数据

截面数据是传统心理研究与教育研究应用较多的数据类型,是指在同一时间截面上反映一个总体的一批( 或全部) 个体的同一特征变量的观测值为了揭示被试的心理发展水平和教育程度,截面数据可以采用描述统计推断统计多元统计等方法进行分析除此之外,近些年结构方程模型的应用更为广泛,它是因子分析回归分析路径分析和潜变量模型的拓展与延伸,是在已有回归分析的基础上,利用测量模型和结构回归模型表达变量之间潜在关系的方法

纵向数据也称时间序列数据,它是在不同时间点上搜集到的数据,反映个体发展随时间变化的状态和程度教育心理学领域多应用时间序列数据进行研究,如记录并研究儿童记忆能力发展情况或学业成绩变化情况等常用统计分析方法包括重复测量方差分析时间序列分析多元回归分析等,侧重研究总体平均发展趋势问题近年来,多层线性模型潜变量增长模型潜变量混合增长模型,也是时间序列数据分析常用的方法面板数据( panel data) 属于二维数据,是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据大数据时代,获取数据更加迅速便捷,研究者在同一时点上能够获得大量有价值的数据,多时点积累即可满足面板数据要求的数据原型近年来,事件相关电位( EP) 功能性磁共振成像( fMI) 等技术不断成熟,单次实验即可产生客观的数据通过控制实验的影响因素,进行不同时间相同被试的多次观测,搜集到的数据即为面板数据单位根检验协整分析等方法是目前研究面板数据比较常用的一些方法

( ) 非结构化数据

相对于结构化数据,非结构化数据难以使用二维逻辑表来表现它包括所有格式的办公文档文本图片标准通用标记语言下的子集XMLHTML各类报表图像和音频/视频信息等大数据时代下,非结构化数据的有效管理开发与应用是心理学科与教育学科研究的重点

在心理学与教育学领域,应用非结构化数据开展的研究虽然没有十分普及,但总体上呈上升的趋势可预期的非结构化数据分析领域包括文本分析移动智能终端数据分析可穿戴设备数据分析互联网行为分析社会行为数据分析等可用于心理与教育研究的非结构化数据主要包括以下几种类型:

1. 文字数据

文字数据包括人们在互联网线上线下留下的各种文字记录,如网络上创作的文字作品自媒体发表的言论搜索引擎的热门词汇微博微信朋友圈的文字论坛或留言板评论等这些数据,一部分可以直接进行频数分析,另一些需要进行分类编码使其转化为可被分析的数据国外使用的Twitter,国内使用的微博微信等社交平台,都是文字数据海量数据的获取平台清华大学彭凯平等人通过统计新浪微博的词频数据,利用文字数据反映情绪这一特性,分析我国不同地区人口的幸福指数”。安娜亚和博蒂卡里奥( Anaya and Boticario)分析学生在网络学习论坛上发布或回复的信息内容,对学生的合作表现进行判断,从而对学生类别进行划分

2. 多媒体数据

多媒体数据包括可以被记录下来的声音图片视频影像等素材例如软件中的语音聊天记录,由个人用户拍摄并上传到网络上的图片视频资料等Google 公司的图片管理工具Picasa 利用机器学习的算法,对照片中的人物面孔进行识别,从而提供基于不同对象的照片分类功能; 在此研究基础上,研究者能够通过软件识别照片视频监控画面中人物的面孔表情数据,与情绪教学等领域的相关研究结合进行分析,更加客观地研究个体在学习生活中的心理状态

3. 行为数据

行为数据的定义范畴十分宽泛,可以说涵盖了我们生活中可被记录的一举一动通过互联网智能移动设备终端可穿戴设备等电子信息产品,个体的行为数据均可搜集回传至服务器例如,网页浏览时间鼠标运行轨迹手机通话时长实时位置信息,以及特定场景下个体的动作心跳血压等生理指标,等等行为数据可能无法直接用于心理学与教育学的分析,将声音图像转化为数字化信息,再从海量数据中提取有意义的特征,是未来研究的重中之重,也是发挥心理学教育学在大数据时代学科专业优势,促进多学科协同创新的落脚点


【本文由 中国心理学家网 发布,转载须保留本文链接!手机浏览网页显示不完整时,请点击网页底部的电脑版。欢迎关注本站微信公共号:xinlixuejianwang 分享按钮

相关专题: 最新文章
专题信息:
  全国正规的心理咨询师培训(2022/5/3 18:11:22)[2589]
  心理学专业英语词汇(C1)(2021/8/9 12:16:08)[1898]
  心理学专业英语词汇(B)(2021/8/9 12:13:58)[1607]
  基于积极心理学的高职院校教师职业心理调适(2020/12/12 23:45:29)[2111]
  新冠肺炎疫情下高校大学生心理问题与疏导(2020/12/10 23:41:39)[2857]

相关信息:
 没有相关信息

相关评论:
 没有相关评论李晶 俞国良
发表、查看更多关于该信息的评论 将本信息发给好友 打印本页
版权所有  中国心理学家网技术支持创立互联    通讯地址:安徽医科大学医学心理学150#   邮编:230032

联系电话:0551—2826223  E-mail:cnpsy@126.com QQ:619938829  皖ICP备 06003963国内心理学类综合性门户网站