文 | 田哲
修改 | 苏建勋
2025年头,咱们了解到一件事,国内具身智能独角兽“智元机器人”(便是B站闻名UP主“稚晖君”当CTO的那家公司),在上海,建了一座“数据搜集工厂”(简称“数采厂”)。
这是啥?为啥建?怎样采?一系列疑问涌上咱们心头,咱们决议去看一看。
当然了,在去之前,咱们对一家“数采厂”的作业流程,有一些十分刻板的幻想——在堆满服务器黑盒子的暗淡房间,挂着黑眼圈、发量堪忧的程序员,机械地敲着键盘输入代码……
错错错!当《智能呈现》抵达智元机器人坐落上海浦东的数采厂,发实际际和咱们的幻想,天壤之别!
毫不夸大地说,这完全是美国电影《星球大战》的片场!
《星球大战》电影海报;图源网络
在这座3000平方米的数采厂中,不同主题的房间占有了工厂的绝大部分面积,每个房间都精心复原了实际生活的物件布局,机器人就在不同的场景中履行不同使命。
在卧室中,机器人灵活地学习叠衣服。
机器人学习叠衣服;图源:智元机器人
在餐桌前,机器人把餐具挨个摆放规整。
机器人摆放餐盘;图源:《智能呈现》拍照
机器人还要学会打餐各式菜肴,而且不会手抖。
机器人正在用勺子舀鸡蛋;图源:《智能呈现》拍照
而在商超收银台前,机器人一只手拿扫码器,另一只手拿着产品扫码。
智元机器人正在学习产品扫码;图源:《智能呈现》拍照
观赏完毕后,《智能呈现》见到了数采厂担任人姚卯青,他也是智元机器人具身产品线总裁、研究院履行院长,担任数据驱动具身智能产品研制。
此前,姚卯青曾在Waymo、蔚来轿车等公司担任研制感知算法、端到端大模型。
姚卯青告知《智能呈现》,机器人每完结一个动作,就相当于一条数据,数据将经过机器人的主机上传至云端,智元机器人团队将使用这些数据练习机器人的大模型,然后让机器人实在把握一项技能,比方冲咖啡、熨衣服等。
为了让机器人快速学习技能,智元为它们组织了1对1教育教师——数据搜集员,他们都是年青有生机的小哥哥小姐姐,为了更好地教机器人完结动作,搜集员也需求肢体和谐,动作规范。
数据搜集员们手持设备,手把手地操控机器人完结抓、握、放等动作。有时他们也会头戴VR设备,更精准地让机器人仿照学习人类动作。
据了解,现在智元数据搜集工厂投放了近百台机器人,日均搜集3-5w条数据。
而为了让机器人更快在不同环境中把握尽或许多的技能,智元数据搜集工厂模仿了家庭、零售、服务业、餐饮、工厂五个场景。
在这里,你能发现商超内不只有各类零食,还有葡萄酒、卷烟,乃至连蔬果的价钱也标好了。
智元机器人模仿的商超;图源:《智能呈现》拍照
也有一批机器人涣散在各自“工位”,在桌前学习简略地叠衣服等技能。
机器人们在工位学习不同技能;图源:《智能呈现》拍照
据了解,数采厂面积还将添加1000平方米,可添加更多场景的一起,也能依据客户需求定制化模仿场景。
不过,现在职业界罕见打造如此多样场景的机器人公司,一个问题随之而来:智元机器人下决心打造数据搜集工厂,这一进程是怎么打开的?
关于大多数草创公司而言,将高额资金建造一座工厂用于数据搜集,危险无疑是巨大的,而智元机器人好像没有犹疑,只是用了一个多月就完结建立数据搜集工厂。
促进智元机器人不吝高本钱打造数采厂,这背面,职业现存数据量在供应侧上的巨大空白。
2024年6月,智元机器人决议研制机器人具身智能大模型,这需求海量数据以练习大模型。
姚卯青告知《智能呈现》,机器人经过数百条数据学会一个技能,这些动作往往都是长程使命,比方冲泡咖啡,熨衣服等。
他们曾企图寻觅职业界的开源数据库,但发现高质量、一致格局的数据简直不存在。即便职业界开源了百万条由实在机器人搜集的练习数据集,可是这些数据实际上由不同公司、不同类型标准的机器人搜集,数据质量较低,达不到智元的要求。
姚卯青表明,不同传感器和形状的数据差异过大,将削弱全体练习作用,比方一个六轴机械臂的数据在七轴灵活手机器人上简直无法复用,因而需求一致规范的数据。
而让智元下决心建造数采厂,这个进程也很简略。
姚卯青表明,智元机器人搜集了几千条数据用于练习算法,尽管能让机器人顺利完结某个动作,可是无法泛化——假如改动物体品种、色彩乃至光线,都将影响机器人再次完结相同的动作。因而智元机器人决议建造工厂大规划搜集数据。
不同房间的机器人正在搜集数据;图源:《智能呈现》拍照
数采厂未来将连绵不断为机器人学习供给数据养料。据了解,智元数据搜集工厂投入使用两个多月,就搜集了超百万量级真机数据集,搜集使命超一千种,每个使命都包括几百条数据,一些特别难的长程使命可达几千条。
“不久后咱们将具有超千万条数据。”姚卯青笑着说。
在搜集数万条机器人重复动作后,智元机器人收成了一些意外之喜:机器人可以在未经练习的状况下,依据要求操控倒水量;只教了机器人几十次,就能学会叠裤子。
这正是智元机器人想要打造的机器人——可以自主了解人类指令和外部环境,并能习惯杂乱的环境。
智元期望机器人可以替换不同品牌、类型的咖啡机配件;图源:《智能呈现》拍照
曩昔数十年,机器人的操控往往依托人们的预设规矩,向机器人输入状况描绘以及应对方法的规矩,机器人在相应状况下完结操作。可是机器人遇到的状况千变万化,难以依托提早输入规矩就能让机器人应对一切状况。
在大模型使用迸发后,让机器人从严寒的躯体有了智力,可以了解国际和人类。而智元机器人正在研制的,是具有端到端大模型的机器人,通用才能更强且反应速度更快。
机器人从承受指令到完结动作一般有三个过程:感知外部环境,做出决议计划、操控肢体履行使命,信息在这一链条传递中或许呈现失真,然后影响机器人完结动作。
但端到端大模型,不需求分模块,更不依托精准丈量,就像人类超车前,不会下车丈量两车之间的间隔,再进行超车。
智元机器人对端到端大模型机器人的想象是,机器人可以承受人类的杂乱指令,比方让机器人从远处取来手机,或许从冰箱里拿一包薯片。这些指令不只检测着机器人对使命的了解才能,还要求机器人可以辨认物体,并完结移动到相应地址、取物,回来,提交物品。
可是到达这一状况并不简单。姚卯青表明,需求不断向大模型投喂数据,数据量越大,大模型在某一场景体现会更挨近人类,他预估的数据量为几千万条到1亿条,机器人的Scaling Law远未到来。
《智能呈现》了解到,机器人需求软硬件结合,仅有其中之一都难以让机器人技能迅速发展。美国的硬件本钱较高,因而美国机器人草创公司大多只研制算法。我国已有供应链优势,结合数据和自研的硬件,会让算法、硬件、软件快速迭代。
姚卯青信任,我国机器人技能的全体进展已与美国平起平坐,由于美国的人工本钱比国内高出十倍,还得从我国收购各种零部件。
智元机器人用更低的本钱和高效的迭代速度,拓宽了场景模仿和数据搜集规划,那些在美国机器人公司看来“遥不行及”的技能,正在我国的数据搜集工厂不断流动的数据中,一点点挨近成为实际。
北京的气温今日有所上升,亦庄的半程马拉松赛场上也热闹非凡。
4月19日,2025北京亦庄半程马拉松暨人形机器人半程马拉松正式开跑。共有20支部队参加了此次人形机器人半马,运用的人形机器人产品包含了天工、宇树G1、乐聚夸父、松延动力N2、行者二号、加快进化T1等。
此次竞赛全长21.0975公里,竞赛地势环境包含平地、坡道,最大斜度抵达9°,竞赛线路全体平顺,共包含6个左转道、8个右转道,无折返,转弯视点≥90°,为人形机器人赛队供给了线路GPS坐标数据。每支赛队可在补给站内替换电池、机器人和进入赛道的竞赛选手,替换机器人会有罚时。
虽然不少机器人在竞赛中“踉踉跄跄”,但仍是有不少“选手”成功完赛,终究共有六支部队完赛。天工队(机器人:天工)、小顽童队(机器人:N2)、行者二号队(机器人:行者二号)别离取得冠亚第三名,第四名旋风小子队(机器人:松延动力N2),第五名EAI队(机器人:卓益得X02),第六名为半醒机器人队(机器人:精灵)。
此外,天工队取得了最佳耐力奖,行者二号队、城市之间科技队(机器人:宇树G1)、钢宝队(机器人:幻幻机器人)取得最佳人气奖,行者二号队、城市之间科技队、钢宝队获最佳形状立异奖,行者二号队、城市之间科技队、亦马领先队(机器人:加快进化T1)取得最佳步态奖。
网传视频显现宇树科技G1机器人在首届人形机器人半程马拉松竞赛中跌倒。宇树科技向汹涌新闻记者表明,宇树最近都彻底没有参加任何竞赛。北京的气温今日有所上升,亦庄的半程马拉松赛场上也热闹非凡。4月19日,2...
4月19日,2025北京亦庄半程马拉松暨人形机器人半程马拉松在北京亦庄开跑,20支人形机器人赛队与人类跑者一起应战21.0975公里的才智之旅。天工机器人首先冲线完赛,夺得冠军。(据4月19日央广网报导)
极目新闻评论员 徐汉雄4月19日,2025北京亦庄半程马拉松暨人形机器人半程马拉松在北京亦庄开跑,20支人形机器人赛队与人类跑者一起应战21.0975公里的才智之旅。天工机器人首先冲线完赛,夺得冠军。...
今日上午,首个人形机器人半程马拉松在北京亦庄鸣枪开跑。把机器人这个词拆解一下,有“机器”,也有“人”。机器人跑步和人比起来,有什么不同?为什么机器人奔驰这么难,咱们人跑起来却这么简略呢?戳视频,跟着“...
今日7时30分,北京亦庄半程马拉松暨人形机器人半程马拉松在南海子公园南门开跑。这是全球首个人形机器人半程马拉松,20支人形机器人赛队与跑步爱好者一同冲出起跑线,在21.0975公里长的赛道上应战极限。...