界面新闻记者 | 陆柯言
人形机器人领域再次迎来一笔新融资。
近日,具身智能公司星动纪元宣布,已完成近3亿元Pre-A融资,本轮由清流资本、元璟资本、阿里巴巴联合领投,其它投资方包括策源资本、联想创投、世纪金源等,融资资金将用于加速具身智能技术的原生性突破性研发以及通用人形机器人的商业化进程。
星动纪元由清华大学交叉信息研究院孵化,于2023年8月在北京成立。创始人陈建宇本科毕业于清华大学,并在加州大学伯克利分校拿到了博士学位,他同时在清华大学交叉信息研究院的担任助理教授和博士生导师,从事机器人与AI的研究。
2024年是人形机器人行业有史以来的融资高峰。仅在上半年,全球人形机器人领域融资金额就突破了70亿元人民币,超过2023年全年。在中国,宇树科技、银河通用、智元机器人等头部公司也在今年先后宣布融资,其中宇树科技估值已超80亿元。
11月4日,陈建宇及星动纪元相关投资方接受了界面新闻的采访,谈及投资人形机器人的企业的逻辑和未来可能的技术趋势。
人形机器人被资本追逐,一方面来自于特斯拉雄心勃勃的Optimus人形机器人计划,另一方面则受到ChatGPT的影响。元璟资本执行董事任易在接受界面新闻采访时表示,投资星动纪元的逻辑之一,是看好具身智能领域能够出现真正的大模型公司。
任易认为,由于语言是人类经验密度最高的一种数据,语言模型也成为了新的AI范式下最先突破的领域。但具身智能建模的是人类和世界最原始的互动形式,因此目前还没有出现范式,厂商都在尝试突破,投资机构同样在等待这一突破的时机,也就是属于机器人的「ChatGPT」时刻。
联想创投史晨星则提到,“星动是市场上明确的端到端第一,今年开始大家都在转向具身大模型,星动进展是比较快的。很多企业还是分层路线,上层连接大语言模型,底层用MPC,星动已经完全端到端AI驱动了。”
人形机器人的“端到端”(End-to-End)指的是从传感器输入到执行器输出的整个过程,其中不经过复杂的中间步骤或人工编码的规则,而是通过一个统一的模型来实现。端到端的优势在于,这种方式更接近于人类的思考过程,能够大幅提升机器人的泛化性和通用能力。
这也是人形机器人未来最确定的技术趋势之一。传统的机器人算法需要做较为细致的编程,以命令机器人执行相应的任务,但部分难以建模的复杂动作无法完成,且耗费大量人力物力。正因如此,现有的人形机器人也还很难在工业和家庭场景中发挥作用。
但机器人有了更好的通用能力和泛化性之后,就能更快地实现商业落地。
陈建宇举例,在工业制造场景中,即便机器人从未熟悉过面前的工序,但基于海量数据的训练后,它拥有物理常识和推理能力,能够对新任务进行理解和泛化,首次上手操作即可达到80分水平。在人类演示和练习之后,不断进阶到100分水平。
在未来市场终端应用场景愈发明确的前提下,今年国内人形机器人企业纷纷加大了端到端技术路线上的投入。各家竞逐大模型之际,团队的科研攻关能力往往决定了资本押注的对象。
除了端到端之外,星动纪元的另一个研发重点是增强机器人与物理世界感知交互的能力。而打造一款能够理解时间、空间等复杂信息的“世界模型”,也被认为是具身智能下一个突破。
在陈建宇看来,目前大多数公司都把研发重点放在了机器人的语言图像处理能力(大脑)上,但在物理交互(小脑)层面的努力仍然不够,这也是星动纪元与其他公司最大的差异。
“我们正在做的事,就是把机器人从基于人类知识和先验的建模中解放出来,获得通用的智能。也只有当机器人具备足够的泛化性时,就不用针对单一任务单独设计机器人的软硬件了,机器人的应用也将随之迎来阶跃式的发展。”陈建宇说。
产品层面,星动纪元在今年发布了首款人形机器人产品星动STAR 1,它的最大负载为160kg,最大奔跑速度高于6m/s,并且实现了端到端的泛化行走与抓取,已面向科研教育市场推出首批产品,且与多家工厂展开接触。
市场对人形机器人的爆发时刻预计,普遍在3-5年以内。在其广泛商业落地之前,投资人仍然需要具有足够的耐心。
策源资本认为,人形机器人的回报周期至少5年起步,初创公司还是需要持续的融资来支撑大量的研发投入。“现阶段希望星动纪元在未来1年在至少一个应用场景形成市场化商业订单,完成一定量台套的出货,这也将考验团队的生产管理能力。”