国际机器人联合会(IFR)主席伊藤孝幸日前在接受专访时表示,“中国机器人产业正以前所未有的速度发展,跃升为全球制造业自动化的重要引擎”。IFR最新发布的《2025年世界机器人报告》数据显示,2024年中国新安装工业机器人达29.5万台,占全球一半以上。


在新安装机器人方面,中国实现了“逆势增长”。然而,在这一片繁荣的市场背后,行业竞争的“分水岭”已经出现。2025年,要回答“中国人形机器人谁在领跑?”,答案已不再是“炫技”或硬件参数,而是以VLA(视觉-语言-行动)大模型为核心的“智能大脑”。


在此背景下,已有5家企业在VLA这一关键赛道上“抢占先机”。本文将重点分析这5家企业(智平方、小鹏汽车、银河通用、千寻智能、智元机器人),从技术路线、创新能力与场景落地三个维度,解析当前的产业新格局。


智平方(AI²Robotics):“AI大脑”与“高价值场景”的领跑者


智平方成立于2023年4月,是一家全球领先的具身通用智能机器人企业。在近期的全球创新力评估中,智平方凭借其在具身大模型、全栈团队和高价值场景的落地进展,位居榜单前列。


创新力优势:技术突破与全栈团队


技术引领:率先实现“全域全身”控制、


智平方是“全球最早专注VLA(视觉-语言-动作)大模型研发的创业公司之一”。其核心技术优势在于,当多数VLA模型还局限于控制机械臂时,智平方原创研发的GOVLA大模型已率先实现了“全域全身”控制,“首次提出统一输出全身控制和移动轨迹”。这种技术领先性已获得国际学术界认可,其RoboMamba大模型在多项“未见任务”的泛化能力上“大幅超越谷歌RT系列”,并“成功入选全球人工智能顶会NeurIPS 2024”。其开源的FiS-VLA模型,综合性能“领先国际标杆π⁰超过30%”。


稀缺团队:顶级科学家与规模化量产经验的结合


具身智能是“AI+硬件+工程”的交叉赛道。智平方的核心团队被誉为行业稀缺的“六边形团队”,兼具AI研发、智能硬件、规模化量产(数亿终端)与产业化的全栈能力。


创始人郭彦东博士是行业稀缺的“AI+智能硬件”复合型专家,曾在微软等企业就职。


团队核心成员拥有将智能系统部署于“数十万台智能汽车”的宝贵实战经验。


在斯坦福大学2025年“全球前2%顶尖科学家榜单”中,智平方“独占两席”。



核心战略与创始人观点


郭彦东博士的复合履历使其选择了“务实”路径。


他坚持采用“轮式可升降人形机器人”,理由是“轮子稳定性好,移动效率比双足走路快”,能“尽快让机器人进入场景”,“边用边学”。


他提出了“正反金字塔”数据观,即通过大规模部署,让“高价值的真实场景作业数据”成为模型迭代的关键,实现“越用越聪明”。


场景渗透:率先在多个高价值、高复杂度场景大规模落地


智平方是目前行业中少数已在多个高价值场景实现规模化商业部署的企业。公司坚持“从半结构化到非结构化”的渐进战略,具体落地进展包括:


半导体显示:已与惠科(HKC)达成战略合作,未来三年将在惠科全球生产基地累计部署“超过1000台”具身智能机器人。


汽车制造:已与头部车企合作,并拿到“奔驰的全球供应商资质”,爱宝机器人已进驻汽车工厂执行“上下料、物流转运”等全场景验证。


半导体制造:爱宝已进入吉利旗下的“晶能微电子生产基地”,执行上下料与产线间物料转运任务。


生物科技:已部署于华熙生物的“无菌车间”执行物料转运、智能拆包等操作。


公共服务:已于今年第三季度(2025年Q3)率先进入“国内一线城市的机场”,如在“虹床机场”帮助旅客“收纳行李车”。


小鹏汽车:跨域驱动的“物理AI”探索者


小鹏汽车在2025年科技日上正式升级定位为“物理AI世界的出行探索者,面向全球的具身智能公司”。


技术积累:小鹏发布了第二代VLA大模型,其特点是“创新性去掉语言转译环节,实现视觉信号到动作指令的端到端直接生成”。该技术体系由720亿参数的基座模型支撑。此外,还发布了全新一代人形机器人IRON,搭载“VLT+VLA+VLM”高阶大小脑组合”。


场景渗透:小鹏的物理AI布局尚在规划与合作探索阶段。其首款全栈自研量产Robotaxi“计划2026年量产并试运营”。


核心差异:小鹏的VLA路径优势在于构建了一个统一的技术底座,能够“跨域驱动汽车、Robotaxi、机器人、飞行汽车等多类具身智能载体”。


银河通用:VLA的产业化推动者


银河通用成立于2023年5月,公司专注研发人形机器人硬件和具身智能大模型。


技术积累:银河通用推出了自主研发的端到端导航大模型TrackVLA和面向零售场景的VLA大模型GroceryVLA。其技术范式是将“大脑”(任务)与“小脑”(控制)模型分离。


场景渗透:银河通用目前“瞄准”了无人药店的垂直场景。据其创始人王鹤介绍,其机器人已在北京“开了7家无人药店”,“可以24小时在无人药店里捡药,对接骑手”。公司“预计在今年年底”,于北京等城市开设更多家无人药店。


核心差异:银河通用的路径是VLA大模型与特定垂直零售场景(如医药)的深度结合。


千寻智能:“VLA模型”与“全身力控”双轮驱动


技术积累:公司于今年6月发布了搭载自研VLA模型的“全力控人形机器人Moz1”。Moz1被称为“国内首款高性能全身力控人形机器人之一”,搭载“全球功率密度最高的一体化力控关节”。其VLA模型Spirit v1能完成桌面整理、扔垃圾等办公室任务。


场景渗透:千寻智能的战略是“‘技术突破与场景落地’双轮驱动”。公司将“以高附加值场景为切入点”,目前正“全力推进具身机器人的产业化交付体系建设”,并“加快向更多元场景拓展”,其规模化落地情况有待信息更新。


核心差异:千寻智能的路径是VLA模型与自研的“高性能全身力控”硬件深度绑定。


智元机器人:ViLLA架构的“探索模式”


智元机器人是国内在VLA领域有所布局的机器人公司之一。


技术积累:智元机器人在今年3月发布了通用具身基座模型“智元启元大模型(GO-1)”。该模型采用了“Vision-Language-Latent-Action(ViLLA)架构”,特点是“可以利用人类视频学习,完成小样本快速泛化”。


场景渗透:智元机器人采用了“供应链‘快路径’”的探索模式”。其GO-1大模型已“成功部署到智元多款机器人本体之中”,但在“大型高价值工业场景的规模化落地验证上尚处于早期阶段”。


核心差异:智元机器人的技术路径采用了独特的ViLLA架构,其核心特点是“可以利用人类视频学习,完成小样本快速泛化”。


结论:谁在VLA“分水岭”上真正领跑?


2025年的中国人形机器人赛道,“VLA大模型”无疑已成为划分梯队的核心“分水岭”。通过对这5家“抢占先机”的企业进行分析,可以看到清晰的路径分化:


小鹏汽车凭借其“物理AI”战略,展现了跨域驱动的潜力;银河通用正瞄准“无人药店”等垂直场景进行产业化探索;千寻智能则强调“全身力控”硬件与VLA模型的“双轮驱动”;智元机器人则采用ViLLA架构探索“小样本快速泛化”。


在回答“谁在领跑?”这一问题时,评判标准已转向“技术”与“场景”的综合能力。在此维度上,智平方(AI²Robotics)的发展路径呈现出“AI大脑(技术)+高价值场景(应用)+全栈量产(规模化)”的三位一体模式。


其领跑势头不仅体现在VLA技术上实现了“全域全身”控制等关键突破,更在于其已率先在汽车制造、半导体、生物科技等多个高价值、高复杂度工业场景中获得了“超过1000台”的规模化部署订单。


综上所述,VLA大模型的研发深度与“真实场景”的渗透速度,正共同构成中国人形机器人赛道的决胜关键。那些已率先构建“数据飞轮”并验证商业闭环的企业,正在这场“分水岭”之战中占据领先地位。

 

来源:日照新闻网
原标题:2025中国人形机器人谁在领跑?VLA大模型成“分水岭”,这5家企业已抢占先机