心理学,是研究人的行为和心理活动规律的科学,自人类出现,便有了对人类心理和行为的关注。1879年,构造主义学派创始人冯特在德国莱比锡大学建立第一个心理学实验室,标志着心理学自此正式成为一门独立的科学。时至今日,人工智能和大数据时代的到来无疑为心理学的研究打开了全新的大门,那么,在新的时代背景下,科学家们是如何运用全新的方式去研究心理学的呢?中国科学院心理研究所计算网络心理实验室朱廷劭老师,为我们带来了名为“人工智能大数据之于心理学”的讲座,指引我们解开复杂行为下的心理之谜。
朱廷劭老师
大数据的优势
行为是心理的外显,这也是心理学研究的基础。通过以下三个小问题,我们不难意识到:行为传递信息,利用行为轨迹,能够识别个体特征,包括心理特征。
但这并非绝对。“路遥知马力,日久见人心”,我们很多时候做出的判断可能是片面的,而这时候大数据的优势就显现出来。基于大数据的大体量和时间可回溯性,可以做到长期纵向跟踪,如朱廷劭教授的团队利用开源的微博数据分析用户的情绪变化。为了宏观地了解微博用户在不同季节和时间的情绪变化,团队以195万微博活跃用户为样本,在四个季节分别下载一周的微博活跃用户数据,利用“中文心理分析系统”计算每一个季节的积极情绪和消极情绪词的频率。
情绪在一天中的变化
由数据和图像可知:从凌晨3点到15点,人们的情绪与阴阳变化的趋势相似,但从17点至凌晨2点则不同,因为古人“日出而作,日落而息”,而今人们在夜幕降临之后还有很长一段的活动时间。如此庞大的数据确保了结论的合理性,但是上述实验没有谈及一个重要环节,关于大量的数据,我们如何进行处理?
人工智能的尝试
朱教授分享了处理方式的发展历程。首先,传统的人工方式显然不妥,而利用检索关键词的方式对于较复杂的研究调查也难以实施,因为语言的使用可能只是心理特征的局部表达,与心理特征有区别。如在朱教授团队的“利用微博调查二孩政策态度”这项研究中,很难通过一些特定的词语来判断用户对二孩政策的态度。因此,在对112万活跃微博用户在2015年11月1日至2016年12月31日间发布的微博进行筛选, 找出“二孩”相关的微博共71533条后,研究共招募了八名主试在集中培训后对这些微博进行人工标注。但巨大的工作量非长远之计,朱老师的团队必须另辟蹊径。
这时,人工智能技术开辟了新可能。人工智能的基础是机器学习,机器经过大量的数据学习才能具备研究所需的要求 。图中表明,首先研究者依据已有的行为数据确定对应的行为特征,并依此建立模型。这个过程中很重要的步骤是 建立心理特征度量,即确立一个判断标准,然后再将这个模型输入机器,进行测试。若测试结果与人工标注结果一致,模型合理。
机器学习并不简单,人工智能也非生而智能,朱教授的团队利用机器学习的方式,建立微博用户的人格预测模型。研究的结果令人振奋,较高的正确率意味着机器学习确实可以参与大数据的处理。基于高生态化的行为大数据,利用机器学习训练得到的预测模型,实现心理指标自动识别,研究人员大大拓宽研究的范畴。
人文领域的新视角
人工智能的心理特征识别还可以用于开展数字人文方面的研究。
由于文学人物是虚拟的或理想化的,无法采用传统心理学中自我报告的方法直接测量,依赖质性分析或精神分析的手段来做出主观推断,难以开展与现实人生相联系的人格及文化分析。 利用已有的人格分析模型,研究团队设计了这样的研究方案:
以路遥的《平凡的世界》为例,朱教授团队分析了主要人物的性格和重大生活事件前后的人格变化。
除此之外,朱教授的团队还对金庸小说和《西游记》等名著进行此类分析,在此不仔细叙述。
在朱教授看来,人工智能大数据的出现将原来“从一个观点出发去寻找数据论证“的旧方法改变成“由庞大数据推导出结果”的新方法。 而在具体的研究过程中,心理学的工作重心转向实验模型的建立。
与此同时,朱廷劭老师强调了实验过程中的人文关怀,坚持走好心理学落地的“最后一公里”。澳瑞森·梅伦曾言:“人类心灵深处,有许多沉睡的力量;唤醒这些人们从未梦想过的力量,巧妙运用,便能彻底改变一生。”某种意义上,心理学家们一直坚持走在这条路上,希望发自内心里的光,共鸣起无数来者的内心里沉睡的力量,勇敢地前行下去。
编辑:徐俊芳
责任编辑:李伶
声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。