📰 来源:36氪

文|王毓婵 编辑|杨轩 当一家机器人公司决定做AI大模型平台和开放生态,它会给行业带来什么? 上个月,智元刚刚跨过“机器人量产下线一万台”的门槛。4月17日,这家由前华为“天才少年”彭志辉与前华为副总裁邓泰华共同创立的机器人公司在合作伙伴大会上,花了大量的时间和篇幅介绍软件上的新产品。相较之下,硬件的篇幅反倒很少。 智元推出了六大AI模型、七大生产力解决方案,并首次公开AIMA(AI Machine Architecture)全栈生态技术体系。这些软件产品将与硬件机器人一起,组成智元“一体三智”的架构。 所谓“一体三智”,“一体”指的是机器人本体;"三智"则包括:运动智能(基础智能,承担物理载体的执行器功能);交互智能(高阶智能,为情绪价值入口);作业智能(高阶智能,提供劳动生产力)。 “智元并不仅仅只是一家机器人公司,更是一家具身智能公司。如果没有跟本体深度耦合的智能,机器人只是一个工具,并不是真正的具身智能。”彭志辉说。 如何让机器人不止会按照写好的程序跳舞、翻跟头,而是在工业、商业和家庭环境里自主承担工作,关键的变量就在于机器人大脑。现在,智元希望做这个“孵化机器人大脑”的平台。 智元联合创始人、总裁兼CTO彭志辉 一口气推出六款AI模型,智元要做“开放生态” 智元创始人、董事长兼CEO邓泰华宣布,智元将于今年推出的六款AI模型,覆盖“一体三智”中的运动智能、交互智能和作业智能。 运动智能方面,将推出两大基座模型:支持感控融合的全身运控基座模型(通过环境感知实现自适应运动控制),以及生成式运控基座模型(以多模态交互实时生成任意动作,无需预编排)。 交互智能方面,在已规模应用的WITA大模型基础上,三季度将发布行业首个端到端具身多模态交互大模型WITA Omni 1.0。该模型保留对话情感、语境、音调、环境等信息,实现自然拟人的情感交互表达,支持中途插话、打断、纠正。 作业智能投入最大、算法人才密度最高。智元近期已发布融合大小脑的GO-2模型、动作世界模型GE-2、开源数据集AGIBOT WORLD 2026、仿真平台Genie Sim 3.0及Genie Studio 2.0。第三季度,还将推出GO-3模型,融合ViLLA架构和世界模型架构,具备了规划推演能力,也具备复杂任务的推理执行能力,数据规模达GO-2的数十至百倍。 邓泰华向台下的产业界合作伙伴们展示了一张图——具身智能发展的XYZ曲线。 具身智能发展的XYZ曲线 X曲线(2022年至2025年)为开发尝鲜期,完成从原型到规模量产的跨越。2023年首款人形机器人发布,完成技术可行性验证;2025年实现5000台量产,机器人从"展品"变成"商品",机器人能“动"起来了。 Y曲线(2026年至2030年)为部署成长期。2026年3月智元机器人万台下线,交互智能与作业智能规模化落地,机器人生产力持续逼近人类水平。 Z曲线(2030年及以后)为部署普及期,具身智能涌现时刻到来——机器人在制造、物流、服务等重点领域的生产力全面超越人类,学习效率和进化速度极度领先,群体智能开始涌现。 按照智元的规划,公司三年走过 X 曲线,实现首个十亿营收;五年走过 Y 曲线,完成万台部署,实现百亿营收;八年迎来 Z 曲线,与全球生态伙伴共创,实现规模化从 1 到 N 推广。这个规划被称为“358宏图计划”,而2026年作为Y曲线的开端,被称为"部署态元年"。 总裁兼CTO彭志辉说,智元判断2026年为突破点,是因为“有三个要素在今年同时成立”——大模型的突破;机器人的本体和数据飞轮。 首先,在大模型方面,模型已经让机器人开始能够看懂世界、理解世界。更重要的是这些模型不再是孤立的算法,而是形成了开源的生态,整个加速了机器人技术的迭代。 其次,在机器人本体方面,机器人已经实现了大规模量产,并可以实现7×24小时的稳定运行。 最后,在数据飞轮方面,彭志辉说:“数据飞轮部署的机器人越多,飞轮转得越快,采集的数据也越多,模型的训练能力也就越强。这个飞轮一旦转起来,就将产生指数级的网络效应,智元的判断是2026年飞轮也会开始加速转动。” 基于这样的判断,智元接下来的思路是——本体量产、模型迭代、开源数据,开放生态平台。彭志辉称之为“一条最难,但是也最有复利的路径”。 缺少数据的行业,和重复造轮子的竞争对手 机器人公司在2026年尝试与竞争对手一起走向开放,某种程度上也是资源缺失导致的必然。 2026年,大语言模型和视频生成大模型都在疯狂烧Token,而具身机器人行业却正在经历“无Token可烧”的局面。大模型能像人一样读书,而具身智能要去真实的世界里摸爬滚打才能获取数据——数据的匮乏成为了卡住全行业的瓶颈。 在合作伙伴大会举办的前一天,智元机器人旗下觅蜂科技先发布了一个“一站式物理 AI 数据服务平台


本文转载自 36氪,版权归原作者所有。