首页 景点排名文章正文

机器人连碗都放不好?MIT 搞4400 万3D训练场,笨机器人终于要开窍

景点排名 2025年10月13日 23:51 1 admin

前言

你有没有过这样的困惑?ChatGPT 能帮你写工作总结,Claude 能给孩子讲睡前故事,可家里的机器人连把碗放进消毒柜都做不好,工厂里的机械臂换个零件就 “手忙脚乱”?

其实问题根本不在机器人笨,而在它们没地方好好练!

现在 MIT 和丰田研究院的人搞出了新花样,用 4400 万个 3D 房间当训练场,让 AI 造出来的场景里,堆 34 件东西都不会出现叉子穿进碗里的怪事,这下机器人总算有机会学好真本事了!

机器人连碗都放不好?MIT 搞4400 万3D训练场,笨机器人终于要开窍

老办法全是坑

说真的,以前想让实体机器人学会干活,简直是难上加难。你想啊,机器人要学的不是写代码、算数学,而是抓东西、摆物件这些 “体力活”,这些都得在真实场景里练,可练起来全是坑。

第一个坑就是真实数据难采。

要是想让机器人学收拾餐桌,就得找个人一遍遍演示 “拿碗、擦桌子、摆叉子”,还得用设备录下来。

机器人连碗都放不好?MIT 搞4400 万3D训练场,笨机器人终于要开窍

可每次手的角度、碗的位置都不一样,录 100 次可能只有几次能用,既费时间又没效率。有工程师吐槽,录一天数据,机器人也就只能学一两个简单动作,根本赶不上需求。

第二个坑是 AI 模拟太假。

有人想省事,让 AI 自己生成训练场景,结果出来的东西能气笑人 —— 盘子飘在半空中,杯子嵌在桌子里,最离谱的是叉子直接穿过碗底,这就是大家说的 “穿模”。

机器人连碗都放不好?MIT 搞4400 万3D训练场,笨机器人终于要开窍

机器人要是学了这种场景,到真实世界里肯定得闯祸,碰倒花瓶、摔碎盘子都是常事。

第三个坑是手动搭建太贵。

没办法了就有人手动建数字场景,比如建一个厨房,得先画墙、摆桌子,再一个个调碗、盘子的位置,确保它们放得稳。

一个简单的厨房场景,工程师得忙上好几天,成本高得吓人。要是想多弄几个不同的场景,比如客厅、餐厅,那更是想都不敢想,根本没法大规模给机器人练手。

机器人连碗都放不好?MIT 搞4400 万3D训练场,笨机器人终于要开窍

就这么着,实体机器人卡在训练这步好多年,明明 AI 聊天机器人都这么厉害了,可会干活的机器人却迟迟没法走进平常人家。

新科技有妙招

就在大家觉得没辙的时候,MIT 计算机科学与人工智能实验室和丰田研究院的人站出来了,他们说自己搞出了 “可控场景生成” 技术,专门给机器人造训练场,一下子就把之前的坑都填上了。

这技术的底子特别厚,是在 4400 万个 3D 房间的数据集上练出来的。这些房间里啥都有,大到桌子、柜子,小到盘子、叉子,全是按真实尺寸做的模型,相当于给 AI 准备了一个超大的 “素材库”。

机器人连碗都放不好?MIT 搞4400 万3D训练场,笨机器人终于要开窍

它干活的方式也特别有意思,就像 AI 在画 3D 画。先有个叫 “扩散模型” 的东西,一开始在电脑上瞎涂乱画,全是乱码似的 “噪声”,然后慢慢调整,先画出厨房的墙和地板,再摆上桌子,最后把碗、筷子一个个放上去,整个过程就像从空白画布慢慢变成一个真实的厨房。

但光画得像还不够,还得保证符合物理规律,不能出现穿模的情况。

这时候就靠 “蒙特卡洛树搜索” 帮忙了,你可能没听过这个名字,但肯定知道 AlphaGo—— 当年它就是靠这个方法赢了围棋世界冠军。这个算法的厉害之处,就是能提前想好多步。

机器人连碗都放不好?MIT 搞4400 万3D训练场,笨机器人终于要开窍

比如 AI 要把叉子放桌上,它会先想 “放左边会不会碰到碗?放右边会不会掉下去?”,对比好几种方案后,挑出最稳妥的那个,所以就算堆 34 件东西,也能摆得稳稳的,不会出乱子。

更贴心的是,这技术还特别听话。你跟它说 “厨房桌上放一个碗和四个苹果”,它就能精准做出来,在食品储藏架场景里,听话的成功率高达 98%;就算让它弄个乱糟糟的早餐桌,成功率也有 86%,比之前的 MiDiffusion、DiffuScene 这些方法都高 10% 以上。

机器人连碗都放不好?MIT 搞4400 万3D训练场,笨机器人终于要开窍

要是你说 “用这些东西再摆个新样子”,它还能在不改动其他地方的情况下,重新调整物品位置,特别灵活。

亚马逊机器人公司的 Jeremy Binagia 都说,以前的方法要么只在 2D 平面上排东西,要么不管物理规律,这个技术既考虑 3D 的高低左右,又保证东西放得稳,能造出更实用的场景。

机器人连碗都放不好?MIT 搞4400 万3D训练场,笨机器人终于要开窍

丰田的 Rick Cory 也觉得,这技术能造出以前没见过的场景,比如 “餐桌上摆着早餐加笔记本电脑”,机器人练了这个,以后就能避开电脑收拾餐具,离真实应用又近了一步。

结语

其实咱们普通人盼的,不就是家里有个能收拾家务的机器人,工厂里的机器人能更灵活干活吗?

以前这事难,是因为机器人没好的训练场,学不到真本事。现在 MIT 的这个技术,相当于给机器人建了个 “超级学校”,4400 万 3D 场景够它们练个够,还能保证学的都是有用的。

虽然现在这技术还在 “概念验证” 阶段,没法造全新的物品,也没有能打开的柜子、能拧开的罐子,但方向已经对了。

以后再升级升级,机器人就能在虚拟场景里练遍各种活儿,到时候走进咱们家、走进工厂,就再也不会 “笨手笨脚” 了。

说真的,这技术可不是什么花架子,它就是机器人从 “会聊天” 变成 “会干活” 的关键一步,以后咱们的生活肯定能更省心!

发表评论

醉苍生 Copyright © 2013-2024 醉苍生. All Rights Reserved. 网站地图