大数据时代心理学文本分析技术——“主题模型”的应用*
编码,1主题模型,1主题模型的发展,2主题模型的含义,3主题模型的优点,1突出的数据降维能力,2灵活的模型扩展能力,2主题模型在心理学文本分析领域的具体应用,1心理咨询领域的研究,1.1心理咨询文本的探索性
曹 奔 夏 勉 任志洪 林秀彬 徐 升赖丽足 王 琪 江光荣(1华中师范大学心理学院暨湖北省人的发展与心理健康重点实验室,青少年网络心理与行为教育部重点实验室,武汉 430079)
(2福州大学应用心理学系,福州 350108)
(3 Department of Counseling Psychology,University of Wisconsin-Madison,Wisconsin 53703,USA)
人的语言活动包含复杂的心理过程,并且语言也参与诸如知觉、记忆和思维等许多复杂的心理活动(王甦,汪圣安,2006),因此词汇和语言是人们将自己的内心想法和情感转化成其他人能理解的内容最普遍且可靠的方式,是认知、人格、临床和社会心理学家试图了解人类的重要媒介(Tausczik &Pennebaker,2010)。通过语言文字研究人类的心理活动,伴随着心理学发展的整个过程。
但利用传统方法对大文本进行研究面临困境,需要新的研究手段。比如,长期以来心理咨询领域积累的大量咨询逐字稿文本没有被利用(Greenberg&Newman,1996),从上世纪40年代罗杰斯第一次对心理咨询过程进行录音以来,对心理咨询评估的方法就没有什么改变(Weusthoff et al.,2016)。此外,随着互联网技术的发展,人们在社交网络中发表了大量包含各种思想、情感、观点的文本信息,这些文本包含着丰富的心理学含义(乐国安,董颖红,陈浩,赖凯声,2013)。面对大规模富含研究价值的文本数据,使用传统的心理学研究处理方法将带来巨大的人力与时间消耗(朱廷劭,2016)。可喜的是,随着计算机文本挖掘技术及其与统计技术的结合,所发展的计算机化文本分析技术(Computerized Text Analysis)为研究者提供了新的文本研究工具,使得大规模的文本数据研究变得可行(Graesser,McNamara,&Kulikowich,2011;Tausczik&Pennebaker,2010)。
“主题模型” (Topic Model)是计算机化文本分析的重要方法之一,也被称为隐含的狄利克雷分布(Latent Dirichlet Allocation,LDA;Blei,Ng,&Jordan,2003;Griffiths,Steyver &Griffiths,2007),由于对大文本具有强大的分析与建模能力,目前在计算机科学、语言学、管理科学等领域得到了广泛的应用,在心理学领域也有诸多的研究与应用(Kosinski,Wang,Lakkaraju,&Leskovec,2016;Lee et al.,2017) ......
您现在查看是摘要页,全文长 37286 字符。