具身智能基础大模型将在年中出现
作者/ IT时报记者 沈毅斌
编辑/ 郝俊慧 孙妍
科技革命的浪潮正以前所未有的姿态席卷而来。
回首2024年,人工智能、量子计算、卫星星座、生物医药……诸多科技的螺旋上升,让人类对未知世界的好奇心被逐渐满足,与这个世界的关系也正在被重塑。
如今,2025年科技发展的脉络初现端倪,一系列令人期待的成果有望为人类生活带来更多变革。
《IT时报》邀请九位学界和产业界大咖,以专业的视角和前瞻性的眼光,共话2025科技新趋势。
九九归一,所有科技曙光都指向同一个未来:碳基和硅基共存的世界。
春晚上,机器人穿上大花袄,扭起了秧歌,红手帕转得比专业舞者还稳,爆了热搜,惊艳了世界。
进入2025年,具身智能的市场规模和应用场景将进一步扩大,根据PwC的报告,到2025年,具身智能相关技术的市场规模将达到400亿美元。工信部《人形机器人创新发展指导意见》指出,到2025年,人形机器人创新体系初步建立,整机产品实现批量生产,在特种、制造、民生服务等场景得到示范应用。
商业落地前夕,《IT时报》记者对话国家地方共建人形机器人创新中心首席科学家江磊,从具身智能技术、市场、场景三大领域看具身智能2025年发展趋势。
《IT时报》:2025年,具身智能将有哪些主要的技术发展方向?
江磊:硬件方面,2025年我认为人形机器人技术会重新排定,形成由具身智能、数据集、实训场等并列的机器人硬件平台,并且具身智能加核心零部件的端侧智能硬件会成为趋势。
智能方面,世界模型和机器人基础大模型会成为2025年更受关注的焦点,其中,用于具身智能的基础大模型1.0版本会被攻克,时间可能在六七月份。
此外,这次英伟达发布世界模型时提到了一个词,就是post -training(后训练),即让具身智能在实际场景中学习。我觉得从2022年ChatGPT发布到2024年AI爆发,以预训练为主的第一幕竞争基本结束,2025年post-training将成为具身智能行业发展的必争之地。
1月21日,我们和张江集团打造的全国首个异构人形机器人训练场在浦东张江模力社区正式启用,首期将容纳超过100台人形机器人同时训练,应用场景加速落地,将让人形机器人与大模型可以更好融合。
《IT时报》:目前用于具身智能领域的数据面临数量少、质量低等现状,您认为数据问题在2025年会有哪些突破?
江磊:2025年,数据问题解决路径我认为会分为四个层级:第一是打造实训场,让机器人获取真实场景的数据;第二是带着便携端的数据采集设备去工业现场,让实操员穿戴设备收集数据;第三是用虚拟仿真数据生成训练数据,但这个生成数据一定是基于物理数据的放大,可能随机注入几个不同的场景,在参数上调整,让数据集进一步放大;第四也是我们的下一步计划,基于统一的AI基础设施和资产管理平台来组织人形机器人比赛,通过比赛把参赛各方的数字资产给保存下来。
《IT时报》:市场方面,小米、比亚迪、华为等大厂加速布局。您认为2025年具身智能市场将会出现哪些变化?
江磊:目前,具身智能市场呈现两个极端,一个是机器人基础大模型竞争十分激烈,几乎各家人形机器人企业都宣布推出机器人大模型。最典型的就是谷歌团队推出的VLA架构(Vision视觉+Language语言+Action动作),通过视觉感知、语言交互等具体指令,实现动作的直接输出。尽管人形机器人可以实现的效果还需要打个问号,但行业已经出现内卷的苗头。
为避免市场内卷加剧,我认为2025年的开源举措十分重要。从2024年具身智能整体行业来看,因为缺少开源生态,导致具身智能企业都在激烈地竞争技术体系,因缺乏有效的组织而内卷。开源可以将技术成体系地进行规划,从而使更多企业可以参与,并在产业链上形成同向发力。
另一方面,此前很少企业关注到人形机器人的“行走大模型”,这是一块“空地”。此“行走”非双足走路,而是人形机器人在观察世界后,通过知识的学习、沉淀形成知识库,判断手腿的运动模态是什么样,再驱动下一步行动。也可以理解为人类的学习和遗忘机制,即学习案例后沉淀为经验,再将案例遗忘,以经验指导行动。
2025年,越来越多的企业会关注到这方面,并加速在市场上布局和发展。英伟达联合斯坦福大学发布的论文中就在足式机器人的VLA架构上补充了注释和导航,初步实现了长序列任务的学习和技能沉淀,已经成为可行的解决方案。
《IT时报》:目前人形机器人产品售价已经下探至10万元左右,如宇树G1定价为9.9万元。您认为2025年会是具身智能成本和价格下降的关键之年吗?
江磊:2025年,我认为人形机器人价格界限还会在20万元左右,这也是大家普遍接受的一个门槛极限。也许有人认为低价是占领市场的法宝,但如果只做低价,而不能通过生态力量回馈企业,就会造成低价内卷,导致整个行业处于不健康的发展态势。
从成本来看,具身智能产品除了硬件投入外,背后还有巨大的软件成本。现在看到的人形机器人能跑能跳,但要像人类那样在环境中交互,差距还特别大。所以想要用得上又用得起,还是需要具身智能产业进一步规模化。
《IT时报》:2024年,已经有部分人形机器人进入工厂。您认为2025年,具身智能还有可能在哪些行业或领域率先得到应用?
江磊:科技发展要围绕国家的重大需求,根据2025年国家规划,养老服务会成为下一阶段更为重视的场景,所以我们也会在今年加快对养老服务机器人的布局。工业领域如核电、消防等对人类来说具有安全隐患的场景要提前布局。
具身智能是一个未来场景,我建议人们要分不同的眼光来看两类企业:一是短期内能落地的机器人企业,二是未来通用人形机器人的企业。短期落地的具身智能可以是宠物陪伴式机器人,它们可以进行情感交互,也能快速商业铺开,通过陪伴经济获得人类与机器的交互数据,可以促进数据收集;再利用这些数据反哺给未来的人形机器人企业,使其在各自领域完成闭环的终极目标。
排版/ 季嘉颖
图片/ 采访对象 通义万相
来源/《IT时报》公众号vittimes
友情提示
本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!
联系邮箱:1042463605@qq.com