心理信息学:网络信息时代下的心理学新发展

心理科学进展  2015, Vol. 23, No. 2, 325–337 Advances in Psychological Science
DOI: 10.3724/SP.J.1042.2015.00325
325
心理信息学:网络信息时代下的心理学新发展
薛  婷1,2  陈  浩3  赖凯声3  董颖红4  乐国安3
(1天津中医药大学管理学院, 天津 300193) (2阿姆斯特丹自由大学社会科学学院社会学系,  阿姆斯特丹1081HV, 荷兰) (3南开大学周恩来政府管理学院社会心理学系, 天津 300071)
(4鲁东大学教育科学学院心理系, 山东烟台 264011)
摘  要  在见证了社会计算与计算社会科学的勃兴之后, 心理学和信息科学在网络信息时代相遇, 催生出心理信息学这门新兴交叉学科。该学科旨在利用计算机与信息科学技术, 通过开展网络调查和实验、开发和利用移动设备、建立数据库和分类体系、使用开源软件和数据挖掘技术等, 获取、整理和分析心理学研究资料。其对大规模复杂数据的掌控能力, 使心理学家可以从新的高度和视野, 针对现实和虚拟网络中的个体与体心理现象展开研究, 重新检视已有理论假设并探索新发现。但是, 心理信息学在展现巨大潜力的
网络新闻评论同时, 也在技术和研究设计、伦理和研究规范、研究重心与人才培养等诸多方面面临挑战。 关键词  心理信息学; 心理学; 信息科学; 计算机技术 分类号
B849:C93
网络信息时代的到来, 不仅改变了人们的生活方式, 同时也给学术研究范式带来深刻变革。现实世界与网络世界紧密关联, 彼此缠绕, 人类行为痕迹以数据形式大量涌现。心理学研究者愈来愈依赖计算机与信息科学技术, 以探索个体或体的心理和行为规律。应时代特征和学科发展之需诞生的心理信息学(Psychoinformatics), 正是心理学研究者积极尝试利用计算机和信息科学技术, 获取、整理和分析心理学研究资料的新学科(Yarkoni, 2012)。它已然取得一些令人兴奋的成果, 昭示着这门新兴交叉学科, 将从研究方法和研究内容上给心理学注入新的活力。
1  发展背景:心理学与信息科学的相遇
回顾心理学和信息科学各自的发展历史与特点, 不难发现, 两者的相遇并非偶然, 而是两者
收稿日期: 2014-01-27
* 国家重点基础研究发展计划(973计划)项目课题(2010CB731404), 国家社会科学基金重大项目(12&ZD218、14ZDA063), 国家社会科学基金重点项目(12ASH006), 教育部人文社会科学研究青年基
金项目(13YJC190025、11YJC190004)。
通讯作者: 陈浩, E-mail: hull1919@gmail
在学科目的、内容上有所交叉的集中体现, 同时也是其各自寻求发展的必然趋势。
以信息作为主要研究对象、以信息运动规律为主要研究内容、以信息科学方法论为主要研究方法的信息科学, 其主要研究目标是扩展人的信息功能, 尤其是智力功能(钟义信, 2002)。在信息科学研究者看来, 智能本身并不是什么神秘的东西, 其本质就是一种利用信息的能力。现在科学早已发现, 人类是通过感觉器官、传导神经网络、思维器官和效应器官的协同合作来认识世界和改造世界。信息科学技术则试图在这四种人类信息器官的功能基础上, 进一步发展感测、通信、计算机与智能、控制等技术, 以扩展人的信息功能, 更好地完成信息的获取、传递、加工、再生和施用等功能(Brillouin, 1956)。信息的普遍存在性和信息科学的核心目标, 决定了该学科需要不断地从其它领域汲取养分来丰富自己。这一过程也促使信息科学技术逐渐成为一种典型的通用技术, 深入到系统科学、控制论、认知科学、人工智能等诸多学科领域中(钟义信, 2002)。
近半个世纪以来, 信息科学先后与经济学、生物学、神经科学等学科联姻, 诞生出经济信息学(Ecoinformatics)、生物信息学(Bioinformatics)二恶烷
326 心理科学进展第23卷
和神经信息学(Neuroinformatics)等交叉学科。这些领域综合运用信息与计算机科学技术, 探讨了与经济活动有关的信息特征及其运动规律; 生物信息的获取、处理、储存、分发、分析和解释; 神经系统信息的产生、传输、加工规律及编码、存储与提取机理等问题。这些交叉学科在理解和解释各类经济信息现象, 阐明核酸和蛋白质序列数据所包含的结构功能, 以及大脑不同层次活动的生理学和心理学意义上, 取得了许多令人兴奋的成果(邱均平, 2002; 张阳德, 2009; 陈惟昌, 王自强, 陈志华, 安荣姝, 2001)。相比而言, 心理信息学的研究成果一直散落在不同学科背景的新近文献之中。
其实, 心理学和信息科学对彼此的关注和互动由来已久。早在Shannon提出信息论时, 心理学家和其它领域的研究者们就试图将信息论的概念和方法, 用于解决各自学科面临的种种难题, 但因为信息科学自身的不完善以及其它学科盲目的生搬硬套, 许多工作都不同程度地遭遇了困境。近年来, 信息科学技术的飞速发展, 以及学界对语义信息和语用信息的重新关注, 使得信息科学开始肩负起联结技术科学与社会科学的重要使命。采用信息观点和技术重新阐释社会学、心理学命题的尝试, 在扎扎实实地进行着。研究者们相信, 对事物语义信息和语用信息的充分挖掘与利用, 有助于揭示诸如思维、智慧这些高级活动的复杂过程。
心理信息学的诞生, 也得益于社会科学和信息科学领域的研究者们出自不同学科视角的已有努力。最初, 信息科学家们认识到只有深入理解社会科学规律, 才能真正提高信息技术的社会效应, 由此促成了社会计算(social computing)的诞生(Schuler, 1994; 王飞跃, 2006)。从最初的社会软件到后期的一门学
科, 社会计算的内涵不断演进, 当下其关注的核心问题是如何结合信息科学技术和社会科学理论, 对人们在互联网络世界中留下的海量真实数据进行分析, 进而提高信息技术的社会应用价值(陈浩, 乐国安, 李萌, 董颖红, 2013)。
同样是利用信息技术获取、存储并分析网络世界中海量个体行为数据的计算社会科学(computational social science), 则主要立足于社会科学理论视角, 通过引进新的方法和技术探究新时代背景下个体或体间的合作与竞争关系、社会网络结构及其演化博弈等社科核心问题, 属于社会科学与信息科学的交叉学科(Lazer et al., 2009)。计算社会心理学(computational social psychology)是较早就被倡导的心理学与信息技术的交叉研究领域, 其主要特征是利用基于代理建模(agent-based modeling)的仿真模拟技术, 探索由微观个体心理与个体间互动涌现出的宏观模式之间的非线性关系(Smith & Conrey, 2007)。
从心理学单一学科视角来看, 社会计算、计算社会科学虽然带来了研究方法上的革新, 但研究内容过于宽泛, 计算社会心理学又难以代表网络信息时代下心理学研究的整体发展潮流, 无法全面展示心理学与信息科学的密切联系和互动。作为产生和利用信息的真正智能体, 人类的各种心理和行为会影响信息运动的各个环节。同时, 不同信息的性质、所在载体、传递渠道和过程等, 也无时不在影响着个体和体的心理和行为。面对这样一个新交流与生活模式不断涌现、数据不断激增的崭新世界, 心理学也开始面临如何处理大规模多样化数据、探索和建立新模型、建立可共享和可持续发展的数据库等方法论
难题。这些都可借助信息科学所孕育的大量前沿技术在不同程度上获得解决。这预示着将信息科学技术渗透到心理学研究的各个环节和各个领域, 能使双方最大程度上受益, 并擦出新的科学火花。
基于此, Yarkoni (2012)在总结信息科学技术应用于心理学研究过程中的数据收集、资料整合和组织、数据挖掘和分析等方面所取得的既有成果基础之上, 正式提出了“心理信息学”这一新颖的交叉学科概念。作为一个真正立足于心理学整体特和学科发展的新学科方向, 心理信息学重点关注如何在心理学研究的各个环节和各个分支领域中, 借助计算机和信息科学技术促进心理学研究的与时俱进。既有研究表明, 这类方法和认识上的革新不但可以帮助研究者从新视角验证心理学经典理论假设, 并且在探索新的有关个体和体的心理和行为规律方面展示出了巨大潜力, 因此, 它有望成为心理学未来发展的重要方向之一。
此外, 需要注意的是, 同为互联网时代产物的网络心理学(Cyber Psychology), 虽然在研究场域上与心理信息学有所重叠, 但其与几乎关照心理学整个体系和研究过程的心理信息学相较, 在
第2期薛婷等: 心理信息学:网络信息时代下的心理学新发展 327
研究目的、方法和内容上都有所不同。心理信息学关注的是如何应用新技术, 在心理学研究整个过程发挥作用, 促进心理学学科的整体发展。而目前的网络心理学则更侧重以经典理论为基础, 以心理学传统范式为研究手段, 强调网络是心理行为的特殊发生情境, 探索与网络有关的各类心理或行为现象, 属
于应用心理学的分支方向之一。
2研究过程中的方法与工具革新
心理学自诞生伊始就以科学认识论与方法论为学科指导原则, 一直在研究方法上进行探索和改进, 努力形成严谨、成熟的学科研究范式。但与此同时, 心理学研究的科学性不断受到来自学科内外的诸多质疑, 究其原因主要来自于研究方法和技术上的局限。其中, 取样缺乏代表性和研究手段人为性问题比较突出:受人力、时间、经济成本和可操作性限制, 传统心理学研究多以大学生为被试, 即使是大规模调查, 也很难真正意义上代表总体。另一方面, 心理学的核心目标是探索现实生活中人类心理和行为的因果机制, 但典型的实验法研究通常在毫无“人情”的实验室控制情境中进行, 高度抽象并明显脱离实际生活, 这无疑降低了心理学研究的外部生态效度, 制约着心理学的进一步发展(Gosling, Gaddis, & Vazire, 2008; 彭凯平, 刘钰, 曹春梅, 张伟, 2011)。
网络时代的到来以及计算机和信息科学技术的飞速发展, 给心理学研究带来了福音, 以研究方法和技术工具的深刻变革为重要特征的心理信息学, 为心理学研究过程的各个阶段注入了新活力。
2.1数据收集寿星图
管秩
无论是以互联网为平台进行调查和实验, 还是利用移动设备收集各类心理行为数据, 甚或是直接抓取网络生态数据信息, 都使心理学研究数据在数量和质量上有了很大提升。
2.1.1网络实验和调查
相对于其它研究方法, 网络实验和调查对心理学研究者来说并不陌生, 特别是在西方国家, 已经出现了很多方便学者们进行研究的专门化网站。譬如, “调查猴子” (SurveyMonkey)和Qualtrics 就设计了一些易于操作的应用程序, 以便人们能够轻松地创建和管理复杂的研究。为充分发挥网络实验的模拟性和便利性, 这些网站还允许研究者利用简单的JavaScript等编程语言自行设计和实施与现实情境相似的实验。此外, “亚马逊土耳其机器人” (Amazon’s Mechanical Turk, MTurk)等网站的出现, 则使得招募高质量被试变得更加容易和经济。该类网站包含了完整的参与者报酬系统、大规模被试库, 以及从研究设计、招募被试到数据收集的整个简易流程。
面对同行关于网络实验、调查信效度如何的忧虑和疑问, 一些研究者针对利用Mturk等网站招募的样本人特征和收集的数据质量进行了分析。结果发现, 与传统研究样本相比, 网络样本在性别、年龄、地区和社会经济地位等方面都更具区分性和代表性; 虽然人们决定是否参与研究受报酬水平和任务长度的影响, 但通过这些网站仍能快速而经济地招募到被试; 实际的报酬水平并不会影响到数据的质量; 收集到的数据的可信度至少不会低于传统方法, 而且网络调查结果的外部效度不受重复作答者或不认真作答者的影响(Gosling, Vazire, Srivastava, & John, 2004; Buhr-mester, Kwang, & Gosling, 2011)。互联网作为一种新的研究工具, 其价值不仅体现在扩展了心理学的研究平台和实验范围, 更重要的是, 其为解决传统研究的弊端提供了一个可能的新途径。
2.1.2移动设备的应用
安亭事件除了互联网以外, 研究者们对移动设备(如手机)的关注和使用也在不断增多。很多年前, 他们就开始使用各类移动设备记录和收集数据。有研究者通过电信服务商提供的用户电话拨打时间、长度、号码和所处位置等信息, 追踪人们的社会联系, 进行社会网络分析(Campbell et al., 2008; Eagle, Pentland, & Lazer, 2009)。限于数据的匿名性, 那时研究者还未能充分利用到移动设备的传感性、联结性和互动性等功能。
另外一些研究者通过购买或设计特定功能的电子记录设备, 收集相对少量被试较为详细的心理和行为数据。譬如, 一种叫做“电子激活录音器” (Electronically Activated Recorder, EAR)的便携式记录设备(现已开发为iPhone手机的APP), 能定期记录日常生活中人们的声音信息, 帮助研究者了解到真实情境中的人类行为(Mehl, Pennebaker, Crow, Dabbs, & Price, 2001)。性别差异一直是心理学关注的议题。有关女性更加多语健谈的刻板印象, 已深深根植于东西方各类民谚和流行文化中, 且被认为是不证自明的科学事实。其实之前
328 心理科学进展第23卷
很长一段时间, 并没有任何研究系统地记录过大批人的自然交谈过程, 为这一假设提供直接可靠的数据检验。有研究者曾通过分析153个英国公民日常对话的磁带录音推断, 女性平均每天说8805个单词,
男性平均每天说6073个单词。但该研究者也承认, 这种估计存在问题, 因为他缺少有关被试何时关闭录音机的信息(Liberman, 2006)。为更加科学地检验这一假设, 研究者通过使用EAR来对人们在现实生活中的即时互动, 进行不加干扰和不可自控的记录。由此得到的结果是, 男性和女性平均每天说16000个单词, 性别间差异不显著, 但个体间差异显著(Mehl, Vazire, Ramírez-Esparza, Slatcher, & Pennebaker, 2007)。Vazire和Mehl (2008)做的另一项研究发现, 与自己关系密切的人往往比个体本人更能预测该个体的日常行为。这就提醒广大研究者, 通过自我报告评估人们的心理和行为, 甚或是人格特质, 也许远非想象中那般可靠。虽然基于新设备的研究发现了许多令人深省的研究结果, 但这些设备大多昂贵、笨重, 且需要实地分发给被试, 因此在学界并未获得推广。
近年来, 随着智能手机的大幅普及以及受到手机应用软件开发者的启发, 一些心理学研究者着手开发能够供网络下载的手机应用软件, 这类软件通常能够自动管理知情同意、资料收集、资料上传和费用支付等研究过程, 已在心理学研究中崭露头角(Miller, 2012)。Dufau等人(2011)指出, 传统认知心理学研究利用小规模同质自愿者体, 考察注意、记忆、语言等人类认知功能所存在的局限性和可能的取样偏差, 进而展示了将手机作为收集大规模异质人数据的工具的可能性和优势, 以及对整合认知领域相关研究与理论的巨大潜力。其和同事开发的一种多语言版本语言任务决策应用程序, 在4个月的时间内收集到4000名参与者的数据。Eagle 等人(2009)为解决以自我报告为主要数据源的人际互动和社会网络结构研究, 在深度、广度和准确性等方面所面临的瓶颈, 发起了名为“现实挖掘” (reality mining)的研究
项目。该项目通过分析94位智能手机用户连续9个月的位置和通话记录, 以及有关日常行为和人际关系的自我报告, 发现两种数据源的分析结果虽有重叠, 但并不完全一致, 口头报告更容易随互动时间和显著性的变化而发生偏移。并且, 结果显示仅仅依靠手机客观数据就能很准确地推测出人们之间的朋友关系, 甚至能够预测诸如地位、工作满意度等个体水平层面的社会与心理变量。Kill-ingsworth和Gilbert (2010)通过一个基于iPhone 手机的应用软件, 创建了一个大范围人日常生活中的即时思维、感受和行动报告的大规模数据库。在此基础上, 研究者发现人们经常处在“走神” (wondering)状态, 且不管此时正在干什么, 都会伴随不愉快的情绪体验。人们在想什么比人们在做什么更能预测人们的情绪状态。该研究验证了走神实际上是一种认知进化但却以情绪消耗为代价的观点。
2.1.3网络生态数据的抓取
互联网的出现深刻地改变了人们的生活方式:虚拟和现实的界限愈加模糊, 人们通过网络交流信息和情感, 更新自己的近况和活动, 上传和分享图片, 下载音乐和电影, 购买商品和寻求问题答案。计算机和信息科学技术的发展, 使得这些反映现代生活印迹的海量数据得以永久保存, 并可通过一定程序或渠道获得, 为心理学家探究人们的心理生活提供了无以比拟的大规模生态数据库。
从起初通过分析探索社交网络特征(Dodds, Muhamad, & Watts, 2003; Adamic & Adar, 2005), 到随后基于博客的情感分析技术来探索人们的情绪变化趋势(Balog & Rijke, 2006), 及其与现实行为的
相关性(Mihalcea & Liu, 2006; Mishne & Glance, 2006), 再到近年来针对Facebook和Twitter等著名社交媒体网站上海量用户数据的集中挖掘(Dodds, Harris, Kloumann, Bliss, & Danforth, 2011; Gosling, Augustine, Vazire, Holtzman, & Gaddis, 2011; Lansdall-Welfare et al., 2012; Zhang, Fuehres, & Gloor, 2011)。研究者对网络媒介的关注和把握正是为了映射人们的真实生活, 网络发展和技术进步使这一看似单纯的目标得以实现。
2.2数据的组织与整合
为显著提高数据收集和分析工作的学术共同体利益, 心理学研究者们正在积极构建许多分支研究领域下可共享和重复利用的数据库和数据分类体系, 以便对分支研究领域乃至整个学科的多源头数据进行迭代重组与整合工作。
2.2.1数据库的建立
以研究工具技术创新著称的认知神经科学, 可以说是实践心理信息学主旨的典范, 该领域的
第2期薛婷等: 心理信息学:网络信息时代下的心理学新发展 329
研究者已经不再局限于个别研究的新技术吸纳与创新, 而是立足于整个学科领域的发展。一些研究者和研究机构开始致力于开发大规模在线数据库, 以促进跨领域数据的整合和分享。譬如最近建立的一
个公共数据库“千人功能连接组脑项目” (1000 Functional Connectomes Project), 包含了来自35个地区的1400多名被试的大脑功能扫描数据, 为研究者提供了非常有价值的大规模人类静息态数据(Biswal et al, 2010), 有利于对人脑功能的协同深入探索。脑地图数据库(BrainMap Database)和界面管理系统数据库(Surface Management Systems DataBase, SumsDB)等还提供了快速数据挖掘技术、可视化技术、整合与分析不同研究中立体坐标技术(如检索和神经影像分析等), 从而为研究者在不同研究领域间建立连接, 验证已有假设, 以及开发新领域、发展新假设和理论等方面提供帮助(Laird, Lancaster, & Fox, 2005; Dickson, Drury, & Van Essen, 2001; Yarkoni, Poldrack, Van Essen, & Wager, 2010)。
数据库应用的另一重要领域是在线文本情感分析。它通常建立在特定情感词库或语料库基础之上, 通过词汇匹配技术(term-based matching technique), 将文本中的词汇与情感词库或相应语料库中的词语进行匹配, 从而判断文本在情感方面上的倾向或极性(O’Connor, Balasubramanyan, Routledge, & Smith, 2010)。研究者们已经通过人工、自动或半自动化等方式建立了一些情感词库, 如标准英语情感词汇库(Affective Norms for English Words, ANEW)、意见发觉者(OpinionFinder)、情感词语网络词典(WordNet-Affect)和谷歌心境状态量表(Google-Profile of Mood States, GPOMS)等(Bradley & Lang, 1999; Wilson, Wiebe, & Hoffman, 2005; Strapparava & Valitutti, 2004; Bollen, Mao, & Zeng, 2011)。
此外, 很多类似于情感词库的特定领域数据库, 以及其它一些有关人们心理与行为的数据库, 都可在特定社会科学网站, 如哈佛定量社会科学研究所(Institute for Quantitative Social Science, IQSS)的The D
ataverse Network或专业领域数据库, 如开放性功能核磁共振项目(OpenfMRI)中下载。这些共享资源有助于研究者对彼此的研究结果进行比较、验证、扩展和整合, 加速该领域的研究进程。2.2.2分类体系的建立
有心理学研究者担忧如果任凭各类数据库各自为战地独立建设, 可能会导致杂乱无序的学术研究状态, 反而会阻碍各个领域乃至整个学科的发展。因此, 为最大限度利用公共数据库并更有效地对数据进行结构化访问与搜索, 一些心理学家尝试建立全面的心理结构分类体系。Poldrack 等人(2011)的“认知地图集项目” (Cognitive Atlas)就试图建立一个能够被学界广泛认可的认知心理学概念与研究任务的智识体系, 从而促进相关研究的自觉整合。Balota, Yap, Hutchison和Cortese (2013)进一步利用大规模数据挖掘技术, 对三个独立数据库(视觉词语再认数据库、语言启动数据库和再认记忆数据库)进行了统合分析, 尝试建立起能够被共享和公认的有关语言加工过程和关键影响因素的普适原则。这些工作充分体现了大规模数据研究在建立共享数据库、探索各变量间有机、有序联系, 以及建立连续性理论体系中的重要性和必要性。
相关工作刚刚开始, 距离建立起一个容纳所有心理学分支的完整分类体系还有很长的路要走, 但是相应数据库与基础分类体系的完备, 的确会极大促进心理学研究者组织、分享和获取学术共同体协同努力的成果, 从而加速对人类心理世界的探索之旅。
新片介绍2.3 数据分析
计算机和信息科学技术的发展, 给心理学带来的不仅仅是对海量社会生态数据的捕获, 更是一场分析工具和技术上的变革。一方面, 各类开源统计建模软件(如R软件)和Ucinet、KrackPlot、Negopy等网络分析软件, 使很多曾经不能实现的分析变成了可能, 推动了相关研究进程。另一方面, 作为心理信息学数据分析的核心技术, 计算机数据挖掘技术的逐步渗入, 无形中促进了心理学探索性研究的发展, 补充了传统心理学以假设验证为主要特征的研究逻辑, 有助于产生全新的假设和理论。
一些研究者开始利用各种计算机算法进行数据挖掘, 揭示大规模数据视野中人类心理与行为的新特征和潜在新关联。譬如, Yarkoni和他的同事开发了一个叫做“神经合成” (Neurosynth)的计算平台, 该平台利用数以千计的神经影像论文中的数据, 自动生成fMRI元分析结果, 并且能对大

本文发布于:2024-09-22 16:48:13,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/262015.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:研究   心理学   数据   信息   心理   研究者
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议