首页| 论坛| 搜索| 消息
主题:潮声丨从拧螺丝开始,浙江给机器人办了所“职校”
爱我中华发表于 2026-03-10 19:06
潮新闻客户端 执笔 邹冠尔 吴丽燕
台上一分钟,台下十年功。具身智能机器人的应用亦是如此。
走进长三角(德清)具身智能数据采集训练场,你会看到这样一幕:
“车间”内,机器人对准一颗螺丝,缓缓拧紧,指尖的传感器微微闪烁,记录下每一次旋转的力度与角度;“咖啡馆”里,机器人端起咖啡杯,萃取、拉花,转身又拿起清洁刷,细细刷过台面的每一处边角;“客厅”中,机器人俯身整理,将高矮不一的杯子层层叠放,摆件归位的动作轻缓又准确……
德清国际地信城内一家机器人主题咖啡店里,机器人“咖啡师”正在制作咖啡。受访者供图
这幅画面,像极了未来生活的预演。只不过,机器人们还在“上学”阶段。仔细看就能发现,这些动作并不流畅:一个抓取要停顿两秒,一次转身要调整数次,叠被子的角折过来又展开,远不如春晚舞台上那些“功夫机器人”般行云流水。它们每一个笨拙的动作,都被传感器同步记录——视觉、力觉、触觉、听觉,全部转化为数据,送入仿真系统,成为它们“成长”的养料。
今年春晚,很多人有一个直观感受:机器人“活”了。去年还在扭秧歌,今年已经能在舞台上打醉拳、耍双节棍、连续后空翻,甚至和真人演员对打零失误。
但现实世界的复杂,远非演播厅的标准化场景可比。
“具身智能机器人的运动能力已经很强,但在理解环境和自主决策方面,还远不如一个三岁孩子。”浙江无问智行科技CEO刘盛翔说。
所以,它们得从头学起。就像人类孩子要上幼儿园、小学、中学,机器人也要经历一场漫长的“基础教育”。
正是为了教会这些“孩子”如何服务人类,一座专门为机器人办的“专业学校”在浙江应运而生。3月5日,长三角(德清)具身智能数据采集训练场暨业界首个物理AI数据基座平台正式投入使用。
训练场上,从“零”开始
长三角(德清)具身智能数据采集训练场是支撑新型人工智能服务的关键基础设施,由浙江无问智行科技有限公司建设运营。训练场室内总面积达8000平方米,一期已建成3000平方米,1∶1还原了多类真实应用场景,有超过百台数据采集设备,几十个机器人正在这里“上学”。
长三角(德清)具身智能数据采集训练场。受访者供图
在训练场二楼的工业区,数据采集员刘明华正在给机器人“上课”。他戴上VR眼镜、握住手柄,与身旁的具身智能机器人建立连接——透过眼镜,他看到的是机器人头部摄像头传回的画面:一张工作台,一块需要打磨去毛刺的家具板材。“我们做一个动作,机器人的手臂就会跟着做。”他缓缓移动手臂,操控机器人抓取打磨工具,定位到板材表面,开始往复式打磨。打磨完一面,再翻转板材打磨另一面。这套完整的操作流程,他每天要重复5小时左右。
“我刚接触这份工作时,确实会联想到流水线工人。”他摘下眼镜,揉了揉手腕,“但后来想明白了,我们的重复不是机械劳动,而是为了让机器人学会这些技能的必要手段。”同一个打磨动作,要在不同条件下反复练习——板材是实木还是颗粒板,表面平整还是带有纹理,颜色深一点还是浅一点,尺寸大块还是小块。这些对人类来说微小的差异,对机器人而言都是必须从零开始攻克的难题。
和机器人朝夕相处,他有过恐惧,但更多的是热情。“刚开始会想,如果机器人什么都能做,那人还能做什么?但接触久了,想法慢慢转变了:很多危险或繁重的工作交给机器人,人类就能从这些事务中解放出来。从这个角度看,我们不是在‘教会’它们取代人类,而是在‘训练’它们服务人类。”
他把手柄放回工位,“十年后我可能还在机器人背后做数据采集。因为无论机器人怎么迭代,基础数据永远需要人一点点采出来。”
在训练场,机器人的每一次动作,视觉、深度、力觉、触觉、声音等数据都会被同步采集。这些数据经过详细标注后,会被送入仿真系统,在虚拟环境中反复训练,再加入不同光线、不同角度、不同材质的干扰变量,生成海量训练样本。最后,经过仿真训练的模型再回到真实场景进行验证,形成完整闭环。
用通俗的话说,机器人在这里“反复练习”。一次真实操作的数据,可在仿真环境中扩展为大量训练样本,大幅降低企业成本,加快模型迭代速度。从真实中来,到真实中去——这套“三步走”的训练方式,正是训练场的核心设计。
长三角(德清)具身智能数据采集训练场内,机器人正在整理货架上的物品。受访者供图
训练场承担了两个角色。无问智科CTO于春磊打了个比方:一是“教练员”,源源不断地给机器人的“大脑”提供数据燃料,让它在真实场景里自我迭代;二是“裁判员”,通过专业的测试环境,评判机器人的“大脑”到底够不够聪明。
在一墙之隔的街头,它们的“学业”成果已经开始接受检验。3月5日,就在训练场所在的德清国际地信城,一家机器人主题咖啡店开门迎客。店内的“咖啡师”是一只机械臂——研磨、萃取、打奶泡、拉花,全程不到90秒。顾客扫描二维码上传图片,机器人还能把图案打印在奶泡上,实现“咖啡私人定制”。
“3个月前,机械臂操作还不够协调,现在操作流畅多了。”“只此莫干”联合创始人王洋说。这家德清本土品牌与训练场联合打造了这家店,店内机器人服务的每一个动作,同步用于具身智能数据采集。商业运营与技术训练,在这里合二为一。
跨越高墙,让机器人走进现实世界
咖啡店里的机械臂已经运转自如,但训练场内,更多的机器人还在为一个抓取动作反复练习。这让人不禁追问:既然硬件日益强大、算法持续迭代,为什么还要专门为机器人建一所“学校”?
地平线创始人、无问智科首席顾问余凯表示,春晚上机器人的稳、准、美,正是基于大量真实加仿真数据迭代的结果,“这背后,是高质量物理交互数据的千锤百炼,是感知—决策—行动—反馈闭环的极致打磨。”而具身智能要真正走出实验室,面前还横亘着三道高墙。
第一面墙,是数据的巨大空白。
人机交互。图源:视觉中国
如今我们熟知的AI,无论是善解用户心意的豆包、主打高效推理的DeepSeek,都属于数字世界的AI——它们学习的都是互联网上现成的文字和图片,那是二维的、静态的知识。而具身智能要学习的,是三维世界里的物理规律:拿起鸡蛋和拿起铁块,力觉反馈完全不同;帮老人起身和帮小孩递东西,交互逻辑也截然相反。这些关于力度、材质、平衡、因果关系的“物理经验”,需要数百PB级的多模态数据来支撑。
但行业目前积累的,不足百分之一。
那些长尾的、复杂的、非结构化的场景——比如从一堆杂物中精准捏起一枚鸡蛋,在昏暗光线下避开障碍,在不同材质的桌面上擦拭污渍——几乎是一片无人涉足的荒漠。互联网上那些海量的文字和图片,能教会AI吟诗作对,却教不会机器人如何感知一枚鸡蛋的脆弱。因为这些信息在二维世界里根本不存在,只能在真实的物理空间中,由人戴着传感器,一次一次地“教”出来。
具身机器人正拿起一个鸡蛋。受访者供图
德清训练场的第一个使命,正是在这片荒漠里开垦绿洲。每一次抓取、每一次转身、每一次擦拭产生的数据都被同步记录,把那些互联网上没有的“物理经验”,一点点沉淀为结构化的数据资产。
第二面墙,是数据质量的参差。
物理世界AI对数据质量的要求,远高于数字世界。一个标注错误的图片,可能只让AI认错一只猫;但一条力度数据失真的操作记录,却可能让机器人捏碎鸡蛋、撞倒老人。然而当前行业现状是:各家自采数据,格式五花八门;标注各有一套,标准混乱;仿真环境与真实世界严重脱节,在虚拟世界里跑得飞快的模型,一到现实就处处
下一页 (1/2)
回帖(0):

全部回帖(0)»
最新回帖
收藏本帖
发新帖