10月27日,英伟达高级研究科学家范麟熙介绍的有关于合成数据的最新研究项目,他认为合成数据会满足大模型提供的下一个万亿级别token,紧接着,他又介绍了有关于
10月27日,英伟达高级研究科学家范麟熙介绍的有关于合成数据的最新研究项目,他认为合成数据会满足大模型提供的下一个万亿级别token,紧接着,他又介绍了有关于合成数据最新研究MimicGen系统,他表示这套系统是能够生成机器人的训练数据,根据研究论文中显示,MimicGen系统使用不到200个人内演示,就可以自主生成五万个训练的数据任务,其中涵盖了18个类别的任务和多个模拟的环境。
从大量人类示范中进行模仿性学习,这样的方式已经被证明是构建有能力机器人智能体的有效范例,而且这些范例的收集是非常昂贵且费时的,经过这项研究发现,机器人智能体是可以通过模仿学习生成数据集,从而进行有效的训练,在长期和高精度的任务中可以获得更加出色的性能。
除此之外,该研究团队还进一步证明了MimicGen系统所具有的实用性是优于额外收集人类演示的特性,这一点是可以让其扩大机器人的学习规模,从而获得更加强大且经济的使用方法,机器人智能体可以通过模仿学习的方式,在生成式数据集上进行有效的训练,从而在高精度和长期的任务中,获得更加出色的性能表现。
范麟熙还强调,这项研究数据将会全部开源,对于这项研究的具体逻辑,他做出了解释,首先人类远程操控机器人完成一些任务后,就会生成非常具有质量的演示数据,不过这个过程是比较缓慢的,其次在图形处理器加速模拟环境中,可以创建机器人和场景数字孪生,从而在模拟环境中移动对象,基本上就是使用程序生成的方式来扩充机器人的训练数据,最终把这些数据导出到场景进行训练。
英伟达研究科学家范麟熙称 合成 算力提升约三千余倍 我国芯片领 工商业储能迈入发展元年 但落地 临时授权上市的首个DMD基因疗法 媒体:中国学者提出帕金森病新型 蜱虫传播病毒粒子的结构被解析或 马斯克谈及AI监管 监管令人讨厌 苹果第四财季营收报告公布 4个季 波音退出卫星互联网项目 马斯克 这年头还有谁需要富士康 vivo举办开发者大会给手机行业丢 “遥遥领先”并不是中国手机产业 网约车 谁还在死磕 越来越卷的网 疯狂小杨哥带货低俗惨遭翻车 见 微信新增功能登上热搜 史诗级更 苹果官方首次宣告iPhone 15系列 苹果发布新Mac 搭载M3芯片 处理 裁员2000人 大众软件部两年亏260 ChatGPT测试的新功能 根据上下文 七国集团开发AI准则达成一致 开 美国电车进入颓废期马斯克丧了 我国发现万吨至十万吨级铀矿床 封杀亲巴勒斯坦内容 TikTok否认 13年积累6亿多活跃用户 澎湃新系 木质素合成机制 中国科学院新突 智谱AI推出第三代基座大模型 适 人工智能正涌入手机、电脑和神秘 反垄断办回应李佳琦被质疑涉嫌控 成都多名出租司机围堵共享电单车 李佳琦双十一首日卖出95亿 比年