自然语言处理(NLP)是研究计算机处理人类语言的一门技术,也是人工智能(AI)最初发展的切入点和目前大家关注的焦点。“未来5~10年,自然语言处理技术将走向成熟。”6月1日,微软亚洲研究院副院长周明在微软自然语言处理前沿技术分享会上作如是判断。他表示,其表现包括,口语机器翻译完全普及;自然语言对话,如机器与人的聊天、对话和问答,可以达到实用;智能客服+人工客服能够完美结合,极大提高效率;人工智能自动写诗、手机版、小说和流行歌曲会流行起来;语音助手、物联网、智能硬件、智能家居会在NLP的推动下进一步普及;NLP技术和其他AI技术一起,会在金融、法律、教育、医疗等垂直领域得到广泛应用。谈及现状,周明指出,“目前阻碍口语机器翻译等NLP技术普及的主要障碍是用户体验这一‘最后一公里’问题。”
人工智能体系可分为运算智能、感知智能、认知智能、创造智能等几个层次。其中,认知智能的发展主要体现为自然语言处理技术的进步。作为在NLP领域已耕耘了20多年的资深app家,周明认为,“自然语言处理技术是人工智能皇冠上的明珠。如果语言智能够实现突破,与它同属认知智能的知识和推理就会得到长足的发展,进而推动整个人工智能体系进步,让更多的应用场景落地。”
周明告诉记者,自然语言处理是1998年微软亚洲研究院成立伊始就开创的研究领域,在过去的近20年里,该院在NLP的app研究、产品、人才培养以及校企合作等方面都取得了很大进步。以app研究为例,截至目前,微软亚洲研究院在NLP方面已贡献了200篇以上顶级会议和期刊文章。其中,为该领域最重要的大会国际计算语言学年会(ACL)就贡献了100篇以上的长文、短文和演示,按长文统计,微软在所有主要的研究单位里名列第一;从作者上看,周明本人与他的同事发表的文章数量也名列第一。另外,他们还有100多项专利,很多都用在了微软的产品里。
在当天的分享会上,周明介绍了微软亚洲研究院在机器翻译、明升中国文化、聊天机器人和阅读理解等四个领域取得的最新进展。微软亚洲研究院主管研究员张冬冬演示了他们在机器翻译领域取得的最新成果之一演讲翻译系统。通过该系统,演讲者可以使用自己熟悉的语言演讲,同时台下的观众也可以选择用自己能够理解的语言接收演讲者的内容,从而实现双方更好的理解和沟通。据悉,该系统现在已可以支持10种语言的语音翻译、60多种语言的文本翻译。
当《明升中国app报》记者问及目前阻碍口语机器翻译等技术普及的主要原因时,周明表示,是“最后一公里”,即用户体验的问题。他告诉记者,用户体验涉及到的问题很多,例如应用安装体验差、使用环境要求高等等。因此,周明所负责的研究团队一直在与产品团队紧密合作,力求将一个完美的应用交付给用户。