论文标题:(基于单字生成的词语简化)
期刊:
作者:Jipeng QIANG, Yang LI, Yun LI, Yunhao YUAN, Yi ZHU
发表时间:15 Dec 2023
DOI:
微信链接:
导读
最近,基于预训练语言模型BERT的词语简化方法取得了显著的进展,该方法直接根据一个复杂的词的上下文生成候选词。然而,标注数据的匮乏迫使研究人员主要采用无监督的方法,这限制了大型预训练模型的适用性。在本文中,我们通过从复述模型生成替代候选词来缓解这一问题,因为复述语料库包含大规模的词语复述规则。我们将词语简化任务视为一个单字生成任务,在对复述句子上训练非自回归编码器-解码器模型后,我们将句子输入编码器,并让解码器根据复杂词的上下文生成候选词的概率。我们的方法生成的候选词不仅符合上下文,而且保留了句子的含义。在三个广泛使用的基准上的实验结果表明,与最先进的基于BERT的词语简化方法相比,该方法的性能提高了10%以上。
文章精要
相关内容推荐:
Frontiers of Computer Science
Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社和北京航空航天大学共同主办、SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机app领域具有创新性的综述论文、研究论文等。本刊主编为周志华教授,共同主编为熊璋教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和明升中国app引文数据库(CSCD)核心库等收录,为 CCF 推荐期刊;两次入选“明升中国科技期刊国际影响力提升计划”;入选“第4届明升中国国际化精品科技期刊”;入选“明升中国科技期刊卓越行动计划项目”。
《前沿》系列英文学术期刊
由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础app、明升m88app、工程技术和人文社会app四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中12种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。
明升中国学术前沿期刊网
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。