智能计算中心8篇论文获人工智能和自然语言处理2022顶会录用发表
2月22日至3月1 ,第36届 AAAI2022(AAAI Conference on Artificial Intelligence)大会线上举办,智能计算研究中心共有2篇论文被收录,并分别做口头报告和海报展示。AAAI是由国际人工智能协会每年举办的学术会议,是人工智能领域公认的权威性顶级会议,也是中国计算机学会推荐的A类国际学术会议。今年AAAI共收到提交的论文9251篇,其中仅1349篇论文被接受,总体接收率为15%,创历史新低。
2月24日,ACL 2022录用结果公布。智能计算研究中心共有六篇论文被ACL 2022主会录取。国际计算语言学年会(Annual Meeting of the Association for Computational Linguistics,简称ACL)是计算语言学和自然语言处理领域的国际排名第一的顶级学术会议,每年召开一次。在中国计算机学会推荐会议列表中被列为A类会议。2022年是第60届会议,将于5月22日至5月27日在爱尔兰都柏林以线上线下混合形式举行。
论文列表及简介如下:
题目:Unifying Model Explainability and Robustness for Joint Text Classification and Rationale Extraction (AAAI2022, Oral, Top 4.5%)
作者:李东方, 户保田*, 陈清财*, 徐土杰, 陶靖枞, 张宇楠
简介:最近的工作表明,可解释性和鲁棒性是值得信赖和可靠的文本分类的两个关键成分。然而,以前的工作通常涉及两个方面中的一个:i)如何提取准确的可解释性理由,同时对预测有益;ii)如何使预测模型对不同类型的对抗性攻击具有鲁棒性。直观地说,一个能产生有用解释的模型应该对对抗性攻击更加鲁棒,因为我们不能相信输出解释但在小扰动下改变预测的模型。为此,我们提出一个名为AT-BMC的联合分类和理由提取模型。它包括两个关键机制:混合对抗训练(AT)旨在使用离散和嵌入空间的各种扰动来提高模型的鲁棒性,而边界匹配约束(BMC)有助于在边界信息的指导下更精确地定位理由。在基准数据集上的表现表明,AT-BMC在分类和理由提取上都比基线有很大的优势。稳健性分析表明,提出的AT-BMC将攻击成功率有效降低了69%。这些结果表明,鲁棒的模型和更好的解释之间存在着联系。
题目:Diaformer: Automatic Diagnosis via Symptoms Sequence Generation(AAAI2022, Poster, Top 15%)
作者:陈俊颖,李东方,陈清财*,周文秀,刘欣
简介:自动诊断已经引起了越来越多的关注,但由于多步骤的推理,仍然具有挑战性。最近的工作通常通过强化学习方法来解决这个问题。然而,这些方法显示出较低的效率,并且需要特定的任务奖励函数。考虑到医生和病人之间的对话使医生能够探测症状并做出诊断,诊断过程可以自然地被看作是包括症状和诊断在内的序列的生成。受此启发,我们将自动诊断重新表述为一个症状序列生成(SG)任务,并提出一个简单而有效的基于Transformer(Diaformer)的自动诊断模型。我们首先设计了症状关注框架来学习症状查询和疾病诊断的生成。为了缓解隐性症状的顺序生成和无序之间的差异,我们进一步设计了三种无序训练机制。在三个公共数据集上的实验表明,我们的模型在疾病诊断上比基线要好1%、6%和11.5%,训练效率最高。对症状查询预测的详细分析表明,应用症状序列生成自动诊断的潜力。
题目:CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark(ACL2022)
作者:张宁豫*,陈漠沙,毕桢,梁孝转,李磊,尚欣,尹康平,谭传奇,徐健,黄非,司罗,倪渊,谢国彤,穗志芳,常宝宝,宗辉,袁正,李林峰,闫俊,昝红英,张坤丽,汤步洲*,陈清财
简介:人工智能技术(AI)以及生物医学语言处理技术的发展正逐步为医学实践提供有效的帮助。近年来生物医学语言理解评测基准的建设,使得人工智能技术在医学领域的应用越来越广泛,然而大多数评测基准仅限于英语,这使得英文领域的成熟技术很难复制到其他语种。为了促进中文医学语言处理的研究,我们收集了真实世界的生物医学数据,并提出了首个中文生物医学语言理解评估基准CBLUE。CBLUE由一组自然语言理解任务组成,包括命名实体识别、信息提取、临床诊断术语标准化、句子语义相似度判断,此外CBLUE还提供了用于模型评估、比较和分析的在线提交平台。为了评估CBLUE评测基准任务的难度,我们实验了11个流行的中文预训练语言,实验结果表明目前最优模型的结果仍低于人类表现。
题目:JointCL: A Joint Contrastive Learning Framework for Zero-Shot Stance Detection(ACL2022)
作者:梁斌,祝清麟,李想,杨敏,桂林,何瑜岚,徐睿峰*
简介:本文提出了一种联合对比学习框架,用在零样本立场检测任务中。本文提出了一种分层对比学习框架,从两个层面来解决零样本立场检测问题。1)在第一层,使用立场类别作为监督信号,提出一种面向立场信息的对比学习方法;2)在第二层,提出了一种原型图网络对比学习。通过构建原形图(prototypical graph),可以有效地在未知目标和已知目标之间建立关系,从而用已学习到的信息表示未知目标,从而提升对未知目标的立场学习能力。在三个公开数据集上的实验结果表明,本文提出的联合对比学习框架在零样本立场检测中取得最佳性能。同时,该框架也能直接迁移至少样本立场检测和跨目标立场检测任务中,并取得最佳性能。
题目:Have my arguments been replied to? Argument Pair Extraction as Machine Reading Comprehension(ACL2022)
作者:鲍建竹,孙婧伊,祝清麟,徐睿峰*
简介:论点对提取(APE)任务的目的是从两个相互关联的论辩性文档中自动抽取论点对。现有的研究通常通过预测两个文档之间的句子级关系来间接识别论点对,但忽略了对整体论点级互动的建模。针对这一问题,本文通过机器阅读理解(MRC)框架分两个阶段实现论点对提取。第一阶段采用论点挖掘查询(AM query)识别两个文件中的所有论点。第二阶段将每个被识别的论点视为一个论点对抽取查询(APE query),从另一个文档中提取与其配对的论点,从而更好地捕捉论点层面的互动。同时,这一框架使上述两个阶段能够在单一的MRC模型中联合训练,从而使它们的相互增益最大化。实验结果表明,本文的方法取得了当前最好的性能。
题目:Multi-Modal Sarcasm Detection via Cross-Modal Graph Convolutional Network(ACL2022)
作者:梁斌,娄辰玮,李想,杨敏,桂林,何瑜岚,裴文杰,徐睿峰*
简介:本文提出了一种有效的基于跨模态图的多模态讽刺识别模型。我们发现,在多模态讽刺识别任务中,对于图片模态,直接学习整个图片的信息很困难,且图片中存在很多与讽刺识别无关的视觉信息。为此,首先使用目标检测(object detection)来识别图片中的重要视觉块以及视觉块的对应描述。随后,将视觉块的描述作为一座桥梁,将离散的视觉块和文本连接起来,构造跨模态关系图。同时,通过引入外部情感知识,进一步挖掘不同模态间的情感不一致性,从而有效识别多模态数据中的讽刺信息。在公开数据集的实验结果表明,本文提出的模型取得了最佳性能。
题目:Improving Event Representation via Simultaneous Weakly Supervised Contrastive Learning and Clustering (ACL2022)
作者:高俊,王伟,禹常隆,赵欢,Wilfred Ng,徐睿峰*
简介:事件是文本中的一种重要信息,学习一个好的事件表示对于很多任务都非常重要。过去的事件表示学习方法通常依赖于一些成本较高的人工标注数据,如篇章关系以及常识知识等。本文结合弱监督对比学习以及聚类,提出了一种轻量级事件表示学习框架SWCC。SWCC不依赖于人工标注的数据,而是采用事件在文档中的共现频率作为弱监督信号来学习事件表示。同时,为了让事件表示在学习过程中能够感知全局信息,我们引入了一种基于Prototype的在线聚类方法。在训练过程中,模型在进行对比学习的同时进行聚类。实验表明本文提出的SWCC模型在事件表示的三个任务上都取得了SOTA结果。同时,在下游任务中也具备较大的优势。
题目:Learning from Sibling Mentions with Scalable Graph Inference in Fine-Grained Entity Typing(ACL2022)
作者:陈奕,程嘉扬,蒋海云*,刘乐茂,张海松,史树明,徐睿峰*
简介:在细粒度实体分类(Fine-grained Entity Typing,FGET)任务中,学习处于特定上下文的实体提及(Entity Mention)的有效特征表示是一个富有挑战性的问题。本文首先通过定量分析发现,现有实体分类技术在上下文信息不足的情况下,对实体提及识别表现欠佳,使得模型的整体性能受限。为此,本文首次探索了利用兄弟提及(Sibling Mention)信息结合图神经网络来增强目标实体提及的表示学习。实验结果表明,本文的方法能够有效提升模型在FGET任务上的性能。
(审核:陈清财、徐睿峰)