汇集多样化数据麻省理工学院开发训练通才机器人的新方法

2024-11-04 18:43 来源:盖世汽车   阅读量:7943   

盖世汽车讯 在动画片《杰森一家》中,机器人女仆罗西可以无缝切换,从打扫房间、做饭再到倒垃圾。但在现实生活中,训练通才机器人仍是一项重大挑战。通常情况下,工程师会收集特定于某个机器人和任务的数据,然后利用这些数据在受控环境中训练机器人。然而,收集这些数据的成本高且耗时,而且机器人可能很难适应以前从未见过的环境或任务。

通过结合大量数据,这种方法可以训练机器人执行各种任务,而无需每次都从头开始。该方法比传统技术更快、成本更低,因为需要的特定任务数据要少得多。此外,在模拟和现实世界实验中,其表现比从头开始训练高出20%以上。电子工程和计算机科学研究生Lirui Wang表示:“在机器人技术领域,人们经常声称没有足够的训练数据。但在我看来,另一个大问题是这些数据来自这么多不同的域、模式和机器人硬件。这项工作展示了如何将这些数据整合在一起以训练机器人。”

受大语言模型启发

机器人“策略”通过传感器观察,如摄像头图像或本体感知测量,跟踪机器人手臂的速度和位置,然后告诉机器人如何移动以及移动到何处。通常情况下,人们通过模仿学习来训练策略,这意味着需要人类演示动作或远程操作机器人以生成数据,这些数据被反馈到学习策略的AI模型中。由于这种方法使用少量特定于任务的数据,因此机器人在环境或任务发生变化时经常会失败。

为了开发更好的方法,研究人员从GPT-4等大语言模型中汲取灵感。这些模型使用大量不同的语言数据来进行预训练,接着输入少量特定任务数据进行微调。基于如此多数据进行预训练,有助于模型适应并良好执行各种任务。Wang表示:“在语言使用域,数据全部都是句子。在机器人技术中,考虑到数据中的所有异质性,如果想要以类似的方式进行预训练,我们需要一种不同的架构。”

机器人数据接受多种形式,如摄像头图像、语言指令和深度图。同时,每个机器人都具有独特的机械性,它们的手臂、夹持器和传感器的数量和方向都不同。此外,收集数据的环境差异很大。MIT团队开发了一种名为异构预训练转换器的新架构,可以统一来自不同模式和域的数据。研究人员将一个机器学习模型(称为转换器)置于架构中心,以处理视觉和本体感觉输入。转换器与构成大语言模型主干的模型属于同一类型。

研究人员将视觉和本体感觉数据对齐为同类型输入,以供转换器处理。每个输入都使用相同固定数量的通证(token)表示。然后,转换器将所有输入映射到共享空间,通过处理和学习更多的数据成长为巨大的预训练模型。转换器越大,其性能就越好。用户只需向HPT提供关于机器人的设计、设置和他们希望其执行任务的少量数据。然后,HPT会将转换器在预训练中获得的知识转移到学习新任务中。

实现灵巧的动作

开发HPT的最大挑战之一是创建大规模数据集来预训练转换器,其中包括四类52个数据集,包括人类演示视频和模拟。研究人员还需要开发一种有效方法,将来自传感器阵列的原始本体感觉信号转化为转换器可以处理的数据。Wang表示:“本体感觉是实现许多灵巧动作的关键。我们架构中的通证数量总是相同的,所以我们同样重视本体感觉和视觉。”

当测试HPT时,与每次从头开始训练相比,它在模拟和现实世界任务中的表现提高20%以上。即使任务与预训练数据非常不同,HPT仍然可以提高性能。卡内基梅隆大学机器人研究所副教授David Held(未参与这项工作)表示:“本文提供了一种新颖的方法,以训练跨多个机器人实施例的单一策略。这可以跨多种数据集进行训练,使机器人能够学习方法,从而明显扩大它们可以进行训练的数据集规模。它还允许模型快速适应新的机器人实施例,随着新的机器人设计不断涌现,这具有重要意义。”

未来,研究人员希望探讨如何通过数据多样性来提高HPT的性能。他们还希望增强HPT,使其能够处理未标记数据,如同GPT-4和其他大语言模型。David Held表示:“我们的梦想是拥有一个通用机器人大脑,人们可以下载并将其用于自己的机器人,而无需进行任何训练。虽然这还处于早期阶段,但我们将继续努力,并希望通过扩展实现机器人策略突破,就像大语言模型一样。”

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

热门

一键全自动换电——泰州市首家蔚来第三代换电站在兴化戴南上线
一键全自动换电——泰州市首家蔚来第三代换电站

一辆新能源汽车稳稳地停到蔚来充换电一体站的停车平台上,汽车下部的换电装置自动开启,卸下用完电的电池,换上充足电的...更多>

喜报!中诚信托荣获深交所优秀债券投资交易机构奖项
喜报!中诚信托荣获深交所优秀债券投资交易机构

2月27日,深圳证券交易所组织召开2022年度债券监管发展业务座谈会,并表彰在服务国家重点战略、推进债券市场高质...更多>

人民银行:指导银行将个人信贷延期还款政策落到实处
人民银行:指导银行将个人信贷延期还款政策落到

2022年第一季度金融统计数据新闻发布会现场。人民网黄盛摄人民网北京4月14日电(黄盛)今日,中国人民银行(以下...更多>

发放消费券、举办消费节、推动线上线下消费融合,近期一批促消费措施密集推出—— 为消费升温积聚合力
发放消费券、举办消费节、推动线上线下消费融合

4月20日是海南离岛免税政策落地实施11周年。11年来,海南离岛免税销售金额和购物人数不断攀升,离岛免税购物已成...更多>

线上线下加速融合,新型业态惠民便民—— 商业新模式激发消费新活力
线上线下加速融合,新型业态惠民便民—— 商业

在上海街头,一家集合了艺术展览、画材、图书、生活家居、艺术衍生品、服装零售等多种业态内容的超级百货集合体验店,吸...更多>

聚焦

京东方A:第一季度净利润43.89亿元同比下滑16.57%
第六届石墨烯创新创业大赛暨金桥8226;永安
为充分发挥上海展会优势,8月21日,“第六届中国福建(永安)...更多>
十二部门:到2026年力争核技术应用产业年直
10月31日,国家原子能机构、国家发展改革委、国务院国资委等...更多>
华为F5G全光园区2.0全新升级并发布场景化
近日,华为全联接大会2024期间,在以“全面光进铜退,共赢园...更多>
“虚实之界:奇迹之书《马可·波罗游记》”主题
东方网记者项颖知报道:今年是中意建立全面战略伙伴关系20周年...更多>
因保障品质消费获得年轻人喜爱和信任得物App
近日,得物App以保障品质消费获得年轻人的喜爱和信任,入选“...更多>
第六届石墨烯创新创业大赛暨金桥8226;永安
为充分发挥上海展会优势,8月21日,“第六届中国福建(永安)...更多>
独立4年后,荣耀要走自己的路:与华为“分道而
2011年,小米如日中天,为抢占互联网手机市场,华为推出了一...更多>
比亚迪海洋网:三年销量破350万辆,新品类新
2024年11月,比亚迪海洋网迎来了其成立的第三个年头,仅凭...更多>
媒体视角——共建人民城市—光明乳业:坚守益民
今年,是人民城市理念提出五周年,各大主流媒体纷纷推出“共建人...更多>
拒绝钞能力开道,通义给国产AI打了个样
在国内,有这么一款大模型,能让周鸿祎公开站台,让朱啸虎独爱之...更多>