2024年,具身智能已经从科幻世界逐渐走进现实,人形机器人则是具身智能最重要的载体。
数字最能直观反映人形机器人市场空间的快速增长。
据中国人形机器人产业大会近期发布的报告显示,2024年中国人形机器人市场规模将达到27.6亿元,2030年有望成长为千亿元市场。
不断增长的市场规模,意味着不断有新玩家入场。
2024年11月13日,人形机器人品牌灵宝CASBOT正式发布首款全尺寸双足人形机器人“CASBOT 01”(昵称“星期三”)。这是一款多场景落地的通用类脑智能机器人,身高179cm、体重60kg,整机拥有52个自由度,算力达550T,续航时间超过4小时。
目前,灵宝CASBOT成立仅不到1年,已和多家应用侧企业建立密切联系,来到商业化前夜。
灵宝CASBOT是北京中科慧灵机器人技术有限公司旗下人形机器人品牌。这是一家专注于通用人形机器人与具身智能领域的创新型企业,其天使轮融资由联想北京科技有限公司领投。
为什么灵宝CASBOT能在短短1年内就推出第一代产品,并快速推进商业化?
在CASBOT 01正式发布前一天,灵宝联合创始人兼CTO马世奎、联合创始人兼COO张淼与甲子光年等媒体深入交流了灵宝CASBOT背后的故事。我们发现,“以终为始”,就是灵宝CASBOT的终极密码。
一、场景驱动技术迭代
机器人一直被业内称为“制造业皇冠上的明珠”。
之所以有这样浪漫的比喻,核心就在于机器人系统的复杂性。而人形机器人无疑是皇冠上最亮的那颗明珠。
马斯克、黄仁勋、Sam Altman等大佬都对人形机器人有着近乎偏执的追求。
但在人形机器人融入人类世界的过程中,技术是第一道难以迈过的关卡。人形机器人厂商核心要解决的问题,是如何让机器人在真实世界的场景中,拥有人类水平的思考和工作能力。
灵宝CASBOT瞄准对产品精度、可靠性、稳定性高要求,且需要长时间作业的场景,如高辐射、航天等特种场景以及工业制造场景等,根据场景需求,反向驱动技术迭代。
CTO马世奎表示,灵宝CASBOT采用全栈自研的软件系统,并自研了机器人关节、灵巧手及少量传感器等部分硬件。
“我们不追求软硬件全栈自研,都是从场景出发,如果外部产品能满足我们的需求就直接外采,无法满足就自研。”马世奎说。
“核心还是考虑到产品的实际落地效果。一旦产品出现问题,自研软件及核心硬件能够让我们快速定位问题,降低和客户的沟通成本,保证客户的业务顺利推进。”COO张淼进一步解释道。
具体来看,“大脑”层面,在评估业内主流的“端到端具身大模型、分段决策模型以及示教模仿训练技能模型”后,灵宝CASBOT选择了分层端到端模型技术路线,结合各种路线的优势,并规避其不足。
在模型训练方面,灵宝CASBOT采用了从实到虚、数据合成、混合训练、再从虚到实的创新技术路线。通过分层端到端模型和混合训练技术,能够让机器人更加智能、灵活和自主。 当“本体”和“大脑”紧密协作,机器人便获得了高层认识、理解和决策规划的能力。
CASBOT 01的头部具有两个自由度,配备了多个RGBD相机、激光雷达和IMU等传感器,能够进行视觉和听觉的双重交互,在操作框架下,通过端到端多模态灵巧操作大模型、蒸馏与量化技术等,成功实现机器人手部对“环境、对象、任务”的泛化和适应能力。
硬件方面,灵宝CASBOT自主研发了包括行星、谐波,以及直线三大系列一体化关节,峰值扭矩密度最高可达207Nm/kg,关节效率超80%。
同时,作为完成精细操作的末端执行器,灵宝CASBOT 自研五指仿生灵巧手,力求解决“灵巧”和“作业”两方面的难点。在软件、硬件的强力支撑下,实现了可快速学习、可泛化的长时序灵巧操作。
谈及自研关节和灵巧手的原因,马世奎表示,目前很多关节电机都在卷参数,但实际落地时还要考虑可靠性、散热、重量等因素。
同时,关节在机器人硬件成本中占比高达60%,自研关节能够最大程度保证成本可控。对于灵巧手而言,市面上现有的灵巧手产品尺寸较大,难以在工业或特殊场景的狭小空间中进行精密操作。
值得注意的是,灵宝CASBOT主要负责自研硬件的设计,生产环节则依托于国内强悍的供应链体系完成。
此外,在机械结构设计部分,经过多次优化,灵宝CASBOT平衡了运动范围和造型美观度。在大量减轻整机重量的情况下,采用高强度金属材料加工复杂曲面,形成了中间加固的超薄空心腔体,保证了结构的稳定性和抗冲击性。
二、从B端切入,探索C端终局
有了产品,接下来便是商业化探索了。toB还是toC,是所有机器人厂商逃不过的选择题。
而灵宝CASBOT的策略是,从B端切入,并同步探索C端应用。
谈及选择背后的思考,张淼表示,B端是半结构化场景,需求定义更明确,客户购买决策取决于产品成本及使用效果;而C端需求更模糊,消费者对成本更敏感,且在道德伦理层面仍需更多政策支持,研发过程中要面对更大的不确定性,对泛化要求更高。
同时,从团队禀赋来看,灵宝CASBOT团队很多成员都曾在中国科学院自动化研究所有多年研发经验,团队此前曾参与C919大飞机柔顺装配机器人等项目,在B端积累了充分的经验。
在具体路径上,作为一家新锐企业,为更好打开B端市场的大门,灵宝CASBOT和标杆客户共同摸索了一条双赢的道路。
2024年9月,灵宝CASBOT和联想制造即服务签署了战略合作协议,成为了联想“火种计划”的首批核心合作企业。
据张淼介绍,在沟通天使轮融资时,联想和灵宝CASBOT就已经确立了投资和业务共同推进的策略,双方打造了“双向赋能”的合作新范式,为灵宝CASBOT的人形机器人产品商业化落地与应用奠定了基础。
对联想来说,联想智能制造工厂引入灵宝CASBOT在柔顺力控、精密操作等方面的技术创新,不仅可以提升生产线的自动化水平,降低生产成本;对灵宝CASBOT而言,真实的商业化场景,能够积累更多真实场景数据,赋能技术迭代,进而达到真正的行业“通用”。
例如,灵宝CASBOT可以在联想笔记本生产线落地应用,凭借双臂双手的混合力/位置控制、手-眼-脑高效协同等能力,满足笔记本生产的精密装配需求。
在可预见的未来,除工业场景外,灵宝CASBOT还将逐步在航天航海、应急救援、井下作业和商业服务等多个场景开展落地:
在航天航海领域,灵宝CASBOT将具备执行空间站维护、卫星捕获和修复等高精度任务的潜力,力求在复杂太空环境下独立应对风险,拓展人类在航天领域的活动边界。
应急救援方面,灵宝CASBOT将实现在辐射、毒气、火灾等危险环境中替代人类进行救援工作,保障救援人员安全,提高救援效率。
井下作业场景中,灵宝CASBOT力求实现多类型感知能力,适应井下复杂地形和极端环境,实现地形测绘、障碍物检测、自主导航和决策,确保在恶劣条件下稳定工作。
最终,随着技术不断迭代,灵宝CASBOT有望广泛应用于C端商业服务场景,如家政服务等,协助人们完成日常生活中的各类事务,如整理衣物、组装家具、更换灯泡等,最终成为家庭场景中的常见智能设备。
三、以终为始,持续迭代
2024年被很多人称为“人形机器人商业化元年”,产业各方都在不断释放积极信号。
1月29日,工信部、教育部、科技部、交通运输部、文旅部、国务院国资委、中国科学院等七部门正式发布《工业和信息化部等七部门关于推动未来产业创新发展的实施意见》。
对于人形机器人,《意见》具体表示,要突破机器人高转矩密度伺服电机、高动态运动规划与控制、仿生感知与认知、智能灵巧手、电子皮肤等核心技术,重点推进智能制造、家庭服务、特殊环境作业等领域产品的研制及应用。
在明确的政策引导、主机厂快速发展的情况下,供应链上游相关组件也在加速完善,下游场景也将加速开放。“现在有很多潜在合作伙伴和客户主动联系我们,希望在具身智能方面有所布局,所以未来人形机器人的市场扩展空间还是很有想象力的。”张淼表示。
值得注意的是,尽管灵宝CASBOT在技术、商业化路径及团队禀赋上已经展露优势,但量产计划能否顺利推进,仍在很大程度上依赖于以具身智能为核心的尖端技术的发展。
原因在于,人形机器人是具身智能的载体,而具身智能的发展,无论是硬件稳定性,数据采集与仿真,具身大小脑模型分层架构或者端到端技术路线,还是终端使用场景,都面临诸多挑战,需要产学研深度协同与广泛联动。
智源研究院理事长黄铁军曾在11月5日“智源论坛·2024具身与世界模型专题峰会”上指出,具身智能的发展是必然趋势,无论是人形还是其他形态的机器人,未来都需要庞大的产业群配套,促进具身智能的关键部件与材料,软件与硬件协同发展。
不过,马世奎表示,虽然中国原创技术和美国存在差距,但中国制造业供应链强悍,“场景多、数据大,中国的AI不会落后。”
接下来,灵宝CASBOT人形机器人系列也将持续迭代。
发布会当天的尾声,CASBOT 01还代替主持人发布了“ONE MORE THING”—— “CASBOT NEXT GEN”。
作为CASBOT 01的升级版,它将搭载Embodied Brain 2.0、视觉基础大模型2.0,以及升级版通用运动先验控制器,和灵巧操作大模型,可完成全身运动姿态跟随控制和人类操作视频数据混合训练,实现运动操作双向提升。
灵宝CASBOT用不到一年的时间,给越发热闹的人形机器人市场提供了一种更务实的新打法——以终为始,从场景需求出发,反向驱动技术与产品迭代,逐步深入真实场景,最终逼近“行业通用机器人”的终极目标。