随着社交媒体平台的发展,人人都是信息的生产者、传播者和消费者,为了保障社交媒体信息的安全可信,谣言检测技术备受关注。在样本充足、领域同分布的高资源数据上,现有谣言检测方法表现优异。然而,在处理涉及跨语言、事件突发的低资源谣言方面,由于缺乏训练数据和先验知识,模型往往表现较差。我校计算机学院(软件学院)张怀文研究员团队提出了一种基于测试时训练的社交媒体谣言检测方法,利用测试时训练和多种对比学习技术,有效增强了模型在跨语言、事件突发等低资源场景下的谣言检测能力。
文章提出了测试时训练的谣言检测方法,以自监督学习(SSL)作为辅助任务,利用局部和全局对比学习生成关于测试样本潜在特征的提示,随后利用这些提示来校准模型。为了缓解测试时训练中分布失真的风险,文章还引入特征对齐策略,使模型能够协同和平衡从训练集和测试集中获得的知识。实验结果表明,这项工作提供了一个有效的低资源域谣言检测方法,提升了谣言检测模型应对突发事件的检测性能。
相关成果发表在2024年的计算机及交叉学科领域顶级国际会议The Web Conference (WWW 2024,CCF-A)上,题为"T³RD: Test-Time Training for Rumor Detection on Social Media"。我校计算机学院(软件学院)张怀文研究员为该论文的第一作者,2022级硕士生刘鑫鑫为第二作者。这项研究得到了国家自然科学基金青年项目、内蒙古大学骏马计划、内蒙古自治区高校青年科技英才等项目的支持。
供稿:计算机学院(软件学院) 编辑:李文娟 审核:刘雪峰