本报讯 丰富的经验来自于艰苦的磨炼,但是一些设备却过于精致或昂贵,难以适应这一过程。因此研究人员设法教会便宜、可消费的遥控飞机一些来之不易的经验,然后由它将知识教给其更加昂贵的同类设备。让机器人学习并以同样的方式共享通用概念,能够让其更好地进行独立决策。
教一台人工智能设备如何驾驶一辆昂贵的飞机飞行有些冒险,因为它需要知道成功和失败意味着什么。“比如你要训练它驾驶一架真正的大型直升机。”美国加州帕萨迪纳喷气推进实验室的Shreyansh Daftry说,“你需要撞机很多次才能让它学会什么是撞机,但这通常来说不可能做到。”
因为不希望用一架昂贵的新遥控飞机冒险,Daftry及其同事选择了一架廉价的交通工具,并尝试使其飞过一片森林,有时让它在障碍物之间穿行,有时让它撞毁。不断练习和试错让机器人了解如何才能让自己飞行得足够安全。
研究人员最后让这架飞机习得的技能转移给更加昂贵的飞机,从而使其可以即刻利用“二手”知识了解如何避免撞向树木。
传输可适用于新情况的技能需要依赖第一架飞机所学到的东西。训练人工智能有时就像训练犬类,机器人得到酬赏还是挨打取决于它的选择,麻省理工学院的Nicholas Roy说。
这种策略适用于很多种机器人,Roy说。让机器人传递它们学会的通用知识,可以使其变得更加独立。“这是对人们头脑中认为的机器人应该如何决策的一次革命。”他说。(冯维维)
《明升中国app报》 (2016-08-16 第2版 国际)
更多阅读