Google 提出新人工智慧模型 PaLM-SayCan 机器人能更容易理解人类语言背後需求

以打翻饮料情况为例,未来机器人在接收「打翻饮料」关键字词之後,将会进一步联想所有与「打翻」、「饮料」等字词组合相关应对方式,最後加上场景识别等判断基础,即可得出需要进行「清理」、「擦拭」等工作,最终则会让机器人选择拿取海绵吸拭洒在桌上的饮料。

Google稍早宣布启用人工智慧模型PaLM-SayCan,将可让母公司Alphabet打造的协助型机器人更容易理解使用者所下达口语指令,进而正确执行工作。

由於机器人所能理解语意,通常与人脑所能理解内容有所差异,例如机器人所能识别指令必须完整、精确,同时现阶段所能理解内容也不能过於复杂、抽象,因此仅能执行「拿起一颗苹果」 (Pick up an apple)此类简洁描述指令,但可能无法理解「我刚运动完,可以帮我准备一些健康点心吗?」 (I just worked out, can you get me a healthy snack?)的指令实际需求。

即便目前已经可以透过诸如GPT-3大型语言模型理解人类语句涵义,但距离让机器人实际理解人类日常生活中的用语背後需求,实际上还有一大段落差,原因在於人脑对於语句背後的情境会有一定程度想像,比方当人打翻饮料时,向他人提出帮忙请求时,就会自然理解需要进行现场状况清理,因此会衍生拿抹布擦拭地面、拿扫把清理碎裂物品等,但机器人目前仍无法实现此类联想,可能仅能从现有资料库比对可行的做法,导致经常出现答非所问的回覆。

而藉由Google此次提出的PaLM-SayCan模型,则是可进一步协助机器人判断人类语句背後潜藏涵义,进而将相关语句转换成可让机器人正确执行的指令内容,并且透过增加任务对应性与技能可行性判断,藉此强化指令执行正确率。

以打翻饮料情况为例,机器人在接收「打翻饮料」关键字词之後,将会进一步联想所有与「打翻」、「饮料」等字词组合相关应对方式,最後加上场景识别等判断基础,即可得出需要进行「清理」、「擦拭」等工作,最终则会让机器人选择拿取海绵吸拭洒在桌上的饮料。

目前Google已经透过GitHub公开PaLM-SayCan模型相关内容,让有兴趣的开发者、设计团队取用测试。

此条目发表在电竞解密分类目录,贴了标签。将固定链接加入收藏夹。
0 0 投票数
Article Rating
订阅评论
提醒
guest
0 Comments
内联反馈
查看所有评论