首页 文章推荐 家电百科 实时讯息 常识

智元机器人姚卯青:机器人的价值在于智能化

0次浏览     发布时间:2025-08-13 00:01:00    

2025年7月27日,上海2025世界人工智能大会上,智元机器人表演舞龙。视觉中国/图

2025年7月以来,具身智能赛道大事不断。

7月12日,智元机器人联合宇树科技中标中国移动超1.2亿元的机器人大单。6天后,宇树科技正式开启上市辅导。

成立于2023年的智元机器人,是目前中国估值最高的具身智能企业,估值一度飙升至150亿元,融资方有红杉中国、高瓴等投资机构,也有上汽、比亚迪等车企,以及腾讯这样的互联网大厂。

但这一赛道可谓“冰火两重天”。知名投资人朱啸虎不久前高喊“清仓看空”人形机器人,因为看不清其商业化路径。

人形机器人商业化究竟发展到了何种阶段?面临什么困难?南方周末记者对话了智元机器人合伙人、具身业务部总裁、具身研究院执行院长姚卯青。

姚卯青毕业于清华大学电子工程系,曾在Waymo、蔚来汽车等任职,后从智驾领域切入机器人赛道,目前负责智元机器人AI技术开发及软件研发工作。

“很多双足机器人视频都是摆拍”

南方周末:创业之初为什么选择做人形机器人?

姚卯青:一方面,早期已经有越来越多人在往这个方向做,包括特斯拉。另一方面,公司的长期使命是用通用机器人来创造无限生产力。我们看下来,通用人形机器人是一个最大公约数。人形不完美,但能够适配不同的任务场景。

长远看,当机器人能够深入到我们的生活和工作,还是希望它能够和我们有一些共情,和我们有一些相似。很多功能型服务机器人在移动功能基础上加一块屏幕也可以,但总会觉得没有那么亲切,不能够真正去做一种深入的陪伴。

南方周末:能回忆一下智元做的第一款人形机器人吗?当时做这款机器人时,是否考虑过市场需求?

姚卯青:第一款人形机器人是公司成立后由一个小团队开发的原型机,叫远征A1。它是双足设计,但由于时间紧迫,膝盖设计成后弯形状,类似鸵鸟的姿态。当时我们考虑过工业场景的应用,膝关节设计成反向弯曲是为了让机器人能更靠近操作台。第一款产品是原型机,主要是测试用,并未商务交付。很快我们就转向了第二代产品的设计。

南方周末:2025年7月9日,智元的A2-W(轮式)在富临精工的工厂开展了三小时的直播,展示了其在工业场景中的应用能力,它目前应用在哪些场景?为什么选择做轮式机器人而不是双足的?

姚卯青:A2-W目前在富临精工工厂进行POC(Proof of Concept,概念验证)项目,主要用于料框码垛,能实现较稳定的持续作业,但仍处于试训阶段。

轮式机器人在工业场景中有优势,稳定性好,续航时间长,移动速度和精度高。双足机器人不适合工厂环境,真正和工业客户交流的话,其实他们并不需要双足,他们对于稳定性的要求还是很高的。工厂里长期应该都是轮式机器人,我觉得现在很多双足机器人在工厂拍摄的视频基本都是摆拍的。

南方周末:那智元的机器人目前主要应用于哪些场景?盈利模式是什么?

姚卯青:我们的机器人主要应用于制造业和工业场景,帮助减少重复劳动;同时也进入科研市场,支撑机器人研发创新;另外,还在交互类场景中应用,如保安、安检、巡逻等。公司成立才两年多,注重自我造血和盈利能力,目标是在未来两三年内实现盈利。当前的商业模式是通过软硬件销售机器人。

南方周末:你前面讲到主要销往工业、科研领域,包括交互领域,哪一领域出货量比较高?

姚卯青:目前,交互和科研领域的出货量较大,但我们更关注工业作业场景。长期来看,后者的规模将更大,代表了生产力。

南方周末:人形机器人在工厂能做哪些场景?

姚卯青:目前工厂主要做物料转运、上下料和物流等工作。我们已在世界人工智能大会上展示物流场景的应用。(详见南方周末2025年8月3日报道《世界人工智能大会:初创公司少了,央企亲自下场,机器人还在找“活路”》)

南方周末:工业领域的应用多是流水线工作,为什么要用人形机器人来解决这些问题?

姚卯青:人形机器人不是用来取代流水线本身,而是替代流水线上的人工操作。工艺并未改变,机器人的角色只是代替了原来由人类操作的部分。

南方周末:车企和工厂需要一套成熟的服务,但目前人形机器人技术还不够成熟,为什么会选择你们的人形机器人?

姚卯青:确实有这样的状况。我觉得汽车场景来讲,现在还不到普遍使用人形机器人的时间点。但我们发现一些细分场景的客户愿意尝试。通常这些场景需要大量劳动力,而且岗位重要,但用工稳定性差,如高离职率。此时,机器人作为更可控的方案就显得有吸引力。客户大规模部署时会考虑投入产出比(ROI),确保机器人成本能覆盖人工成本。一般来说,人形机器人的回本周期大约是两年。总体来说,汽车行业不会是最先普及的行业,最先普及的应该是类似于富临精工这种电子制造类的工厂。

南方周末:7月初,智元机器人中标中国移动7800万元的订单,它的具体功能和应用主要有哪些?

姚卯青:这个项目用的是智元双足人形机器人A2,应用场景主要是移动营业厅迎宾讲解。导购展示还在培育市场需求的阶段,从客户的视角来看,人形机器人对流量有比较大的帮助。

系统工程

南方周末:在跑通商业闭环的这个过程中,你们踩过哪些坑?

姚卯青:我们确实踩过很多坑。首先,客户的识别和匹配非常关键。找到真正愿意接受新技术、对其有合理预期并愿意投入的客户很重要。早期有些项目中,客户的预期和我们的认知差距较大,比如期望机器人能像成熟的自动化设备一样即插即用。其次,工业落地中,客户对成功率和稳定性的要求很高。虽然实验室测试能通过,但如何在全方位的硬件、软件和运营中保证高成功率,仍是一个系统工程。另外,人形机器人的产品成熟度、供应链、制造质量等也需要不断打磨。

南方周末:如果客户的预期与实际完成情况不匹配,如何协调?

姚卯青:比如我们建议客户改造已有的产线设备,使其更适应机器人的操作,或者采用人机混合方式,让机器人大部分时间工作,必要时通过少量人工或远程辅助进行兜底。

南方周末:智元与其他机器人公司有什么区别?

姚卯青:我们与其他公司最大的不同在于智能化的投入。我们从一开始就认为机器人需要智能化,否则其价值会有限。

南方周末:有没有对标的公司?

姚卯青:虽然没有具体的对标公司,但我们会学习和借鉴一些成功公司,如苹果。苹果通过极致的用户体验和软硬件整合,做到了产品的完美运营,这是我们学习的榜样。

南方周末:智元不想做“安卓式”的人形机器人,但苹果式的软硬件一体研发对资金是否有挑战?

姚卯青:对,安卓是操作系统,依赖互联网广告和流量的商业模式。而我们希望做像苹果一样的软硬件深度整合,提供完整的用户体验。

资金方面还好,目前几百人的团队规模和研发支出是可控的,我们的现金储备足以支撑未来几年的发展。当然研发是有侧重的,作为初创公司,我们的规模比较小,底层的芯片我们会使用成熟方案,但在机器人差异化能力的研发上,特别是关节设计、硬件控制、底层软件和上层算法等方面,我们会自主研发。

南方周末:智元也在研发灵巧手,手的操作能力为什么这么难做到?你们的人形机器人是如何学习人的动作的?

姚卯青:下肢运动只是控制自己,而操作则是与外部物体互动。除了控制自己,还需要确保与物体的交互结果符合预期,这涉及物理规律和物体特性的理解。我们通过模仿学习、强化学习和世界模型等方法来探索学习过程。

南方周末:灵犀X1是智元研发的全栈开源人形机器人,2024年10月24日正式面向全球开源。为什么做了开源?

姚卯青:灵犀X1的开源是面向开发者社区的,目的是让更多人了解人形机器人内部的构造、硬件和软件组成。人形机器人还比较新,需要有更多的人参与到这项事业里来。通过开源,我们希望吸引更多人参与,并通过技术社区建设增强公司的行业影响力。我们也不太担心被模仿,成功并不是单纯依赖开源的机器人技术,而是综合能力,包括对场景的理解、市场拓展、生产制造、供应链和质量控制等。

南方周末:智元的股东包括高瓴创投、鼎晖投资、红杉中国、比亚迪、三花控股集团、蓝驰创投等。这些投资人是否会向你们下订单?

姚卯青:腾讯、比亚迪还有京东都刚刚开始接触。现在还没有形成非常完整的方案落地,其实一些投资人的使用场景跟我们目前产品有协同性,也是基于他们真实的需求来跟我们合作,并不是说纯粹股东的扶持。

南方周末:前不久,智元机器人还入主了上市公司上纬新材(688585.SH),外界猜测此举是想要借壳上市?

姚卯青:不是借壳上市。我们确实是和一级市场有一些产业协同。

“一亿条操作数据”

南方周末:投资人朱啸虎认为具身智能尚未到大规模商用的时机,你怎么看?

姚卯青:我认为零部件和供应链尚未成熟,行业还没有像汽车行业那样形成完整的供应链。

南方周末:现在有许多机器人比赛,比如马拉松、格斗等,还有不少公司热衷于做视频展示跑跳,哪些是靠谱的,哪些是噱头?

姚卯青:其实噱头有很多好处,首先带来了大家的关注,其次在关注的过程中,也能让很多人去深入理解人形机器人的发展现状,能更理性地去看待一些事物。因为在这之前,大家对人形机器人会有一些非常高的预期,但通过这些活动,大家也知道它面临的挑战或者困难。

像马拉松、搏击这类项目,我们其实并没有去参与,我们更关注能为客户带来实际价值的场景。运动能力是基础,但机器人更大的价值在于智能化。这些视频主要吸引眼球,更适合早期研发团队。

南方周末:业内不少人认为,目前缺乏大规模用于训练的数据,你是否同意这一观点?

姚卯青:我同意这一点。正因如此,2024年年底,我们进行了大规模机器人数据的开源,是行业首家。我们希望为产学界提供高质量的数据土壤,帮助大家测试和评估算法。我们开源的是一个名为AgiBot World的数据集,里面收集了100万条数据,并公开给全球使用。很多团队与我们联系,期待我们能收集更多数据,尤其是特定场景的数据。

南方周末:未来人形机器人要像DeepSeek或ChatGPT一样表现出色,需要多少数据?

姚卯青:这是行业内的一个开放问题,但普遍认为需要超过一亿条操作数据。这是我们与国内外头部团队交流后的大致估算。

南方周末:具身智能可以分几个阶段?我们现在处于哪个阶段?

姚卯青:具身智能大致可分为三个阶段。第一阶段是基于计算机视觉和传统规划方法的系统,适配成本高。第二阶段是我们现在在做的,通过数据驱动和神经网络让机器人在特定任务中进行自主学习。第三阶段是将这些学习方法进一步升级,完成更多任务,并能通过语言指令完成不同任务。目前,行业整体处于第二阶段,专注于通过学习的方式完成特定场景和任务的端到端系统。

南方周末:有些公司认为,遥控操作机器人采集数据成本过高,应该依赖大量仿真数据。智元的数采工厂是如何工作的?

姚卯青:我们的数采工厂由人工操作员控制机器人进行数据采集。我们并不排斥仿真数据,但仅靠仿真数据无法训练出完整的机器人功能。无论是机器人还是智能驾驶,仿真数据和真实世界的物理规律之间存在巨大鸿沟,虚拟世界训练出来的机器人未必能适应现实世界的物理特性。

南方周末:数采工厂成本如何?

姚卯青:大规模数据采集,每条数据的成本其实非常低。相比之下,对于大模型公司,像国外一些巨头每年对AI的投入达到几百亿美元。仿真数据的成本也很高,因为仿真世界的构建和计算都需要消耗大量的资源。而且,仿真数据无法完全模拟真实世界的物理规律,导致它需要更多数据才能达到真实数据的效果。

南方周末记者 赵继林 南方周末实习生 李文睿

责编 冯叶

相关文章