阿西莫机器人能同时听3人讲话
北京时间6月12日消息,据英国新app家杂志报道,近期,日本高级仿生机器人阿西莫(Asimo)又具备了一项新的强大功能——能够倾听3个人同时说话的内容。
目前,阿西莫有能力判断同时来自3个人的声音,预计今后相应的识别软件能够处理更多的语音数量和复杂的语句。阿西莫具有的这项新功能得益于最新设计的软件——HARK,这是由京都大学Hiroshi Okuno和本田研究协会的Kazuhiro Nakadai共同研制的。
HARK软件使用8个排列的麦克风计算每个声音的来源,并将该声音与其他声音来源相隔离。这8个麦克风的作用就相当于机器人“耳朵”一样,能够可靠地计算提取出单一声音来源,然后再进行语音识别软件进行解码。Hiroshi Okuno告诉《新app家》杂志说,“HARK软件系统具有比正常人听力更强大的分辨能力,它能够同时听到几种声音,而并不是仅仅聚焦特殊的单一声音来源。”当从复杂的语音环境中提取一个单一的声音来源被称为“鸡尾酒会效应”,能够同时聚焦多种语音来源被称为“圣德王子效应”。他说,“依据日本传说,古代圣德王子能够同时倾听10个人的请愿。”
他们指出,虽然HARK软件不能同时辨析10个语音来源,但它能够同时分辨3位谈话者70-80%的语音。Kazuhiro Nakadai说,“在阿西莫机器人的面部和身体里分别安置了8个麦克风,这将帮助阿西莫精确探测和隔离同时出现的语音。”英国谢菲尔德大学的盖伊·布朗指出,虽然阿西莫机器人的这项新功能主要基于语音处理元件,比如:位于局部获取声音来源的麦克风,以及使用自动化软件阻塞难以解释的语音记录。但他还是对于这项研究颇感兴趣。
今年5月,Hiroshi Okuno和Kazuhiro Nakadai将这项最新机器人功能在美国加州召开的2008年度机器人技术和自动控制IEEE国际讨论会上进行了展示。