欢迎来到继续教育培训网院校库!
继续教育培训网首页信息学院教授金琴团队AIM3多媒体计算实验室论文近日被ACL 2022录用。ACL(Association for Computational Linguistics,计算语言学协会)会议是自然语言处理与计算语言学领域最高级别的学术会议,由计算语言学协会主办。
录用论文题目为“M3ED: Multi-modal Multi-scene Multi-label Emotional Dialogue Database”,第一作者为信息学院2017级博士生赵金明,导师为金琴,研究方向主要为情感计算和人机交互。
文章构建了一个大规模高质量的多模态、多场景、多标签情感对话数据集,从56部中文电视剧,大约500集中选取900多个对话片段,并对对话中的每句话进行多情感标签的标注,共标注24,449句话。文章采用主流的6类基本情感标注(高兴、惊讶、伤心、生气、厌恶,害怕)以及正常无明显情感,共7类离散情感。从数据来源选取,对话片段选取,情感标注,标注后处理等方面进行严格把控,以保证数据的质量,最终得到标注者间一致性0.59,高于MELD 的0.43、IEMOCAP的0.48 以及MSP-IMPROV 中的0.49。
另外,文章还提出一个通用的可扩展的多模态的对话感知交互框架,主要包含多模态融合模块以及对话感知交互模块。其中多模态融合用于融合多个模态的信息,对话感知交互模块对于对话中可能交互关系进行充分建模,包含全局交互、局部交互、说话人间的交互、说话自身的交互。通过在主流的多模态情感对话模型以及文章提出的多模态对话感知交互框架对构建的多模态情感对话数据集进行验证,证明文章构建的数据集的有效性和可靠性。同时文章提出的多模态的对话感知交互框架相比主流的情感交互模型能够取得更好或者可比的性能,证明文章提出的多模态的对话感知交互框架能够很好的建模对话中的交互关系。