心理健康问题影响着全球数亿人的生活,然而患者往往面临着双重负担:不仅要承受疾病本身的痛苦,还要忍受来自社会的偏见和歧视。世界卫生组织数据显示,全球有相当比例的心理健康患者因为恐惧社会歧视而延迟或拒绝治疗。
这种「污名化」现象如同隐形的障碍,不仅阻碍了患者的康复之路,更成为了一个重要的社会问题。患者们在承受病痛的同时,还要面对来自不同社会环境中的偏见。更为复杂的是,这种污名化往往以微妙、隐蔽的形式存在于日常对话中,即使是先进的人工智能系统也难以有效识别。
尽管自然语言处理领域在仇恨言论、攻击性语言检测方面已有不少研究,但专门针对心理健康污名的计算资源却相对稀缺。现有数据集主要来源于社交媒体或合成数据,缺乏真实对话场景中的深层心理构建,且往往忽视了社会文化背景的重要性。
新加坡国立大学 AI4SG 实验室联合多学科专家团队,构建了首个基于专家标注的心理健康污名访谈语料库 MHStigmaInterview,希望为这一重要社会问题提供技术支持。该研究获得 ACL 2025 Oral 论文及高级领域主席奖(全会仅 47 篇获此荣誉)认可。
该研究由新加坡国立大学 AI4SG 实验室主导,汇聚了人机交互、计算社会科学、人工智能伦理等多个领域的研究者。AI4SG 实验室专注于人机交互、计算社会科学、人机协作以及社会公益人工智能等交叉研究领域。
研究团队与心理健康领域专家密切合作,为 AI 和 NLP 研究引入了跨学科视角,为计算科学与社会科学的深度融合提供了一个探索案例。
与传统依赖社交媒体数据的方法不同,MHStigmaInterview 建立在心理学理论基础上。研究团队采用了归因模型,将心理健康污名分解为七个核心维度:
认知层面:
情感层面:
行为层面:
这种理论驱动的标注体系,为后续的计算模型提供了相对明确的学习目标。
为了获得更自然的对话样本,研究团队设计了聊天机器人访谈系统。该系统通过三个阶段引导参与者:
系统会根据参与者回答的详细程度自动调整后续提问策略,以获得充分的信息。
经过严格的伦理审查和数据筛选,最终语料库包含:
数据分析显示:
研究团队在该语料库上测试了当前主流的大语言模型,包括 GPT-4o、LLaMA-3 系列、Mistral 等。
性能表现:
通过对 137 个错误分类案例的分析,研究团队发现了一些值得关注的模式。这些隐性污名化表达在日常对话中较为常见,但往往难以被识别。
语言层面的表达特点:
语义层面的深层模式:
这些发现揭示了现代社会中污名化表达的复杂性和隐蔽性,也说明了开发更精准识别系统的必要性。
语料库记录了参与者的社会文化背景,初步分析显示了一些有趣的模式:
这些发现为理解污名化的社会根源提供了基本初步线索。
该语料库为多个研究方向提供了资源。
技术应用:
研究拓展:
社会应用:
MHStigmaInterview 语料库的发布为心理健康污名的计算研究提供了一个新的起点。虽然这是初步的探索,但它展示了技术在解决社会问题方面的潜力。通过持续的跨学科合作和技术改进,作者希望能够为构建更加包容的社会环境贡献一份力量。
这项工作指出,在追求技术进步的同时,关注技术的社会影响和人文关怀同样重要。只有将技术发展与社会需求紧密结合,才能真正实现技术向善的目标。
参考资料:
https://aclanthology.org/2025.acl-long.272.pdf
https://github.com/HanMeng2004/Mental-Health-Stigma-Interview-Corpus
文章来自于微信公众号“机器之心”。