ICRA 2026对话速腾聚创杨先声:为机器人打造精准“慧眼”,开启通用智能新篇

   发布时间:2026-06-16 06:41 作者:格隆汇

在ICRA 2026的展会上,全球具身智能企业纷纷展示最新技术成果,但一个关键问题却鲜有人提及:机器人至今缺乏真正可靠的视觉系统。这一瓶颈导致机器人难以精准感知三维世界,无法完成精细操作,动作效率远低于人类。为突破这一困境,速腾聚创副总裁杨先声在学术汇报中推出全新视觉感知架构,通过物理层融合深度与RGB信息,为机器人打造更高效的"眼睛"。

传统方案多采用"先采集后融合"模式,需通过算法校准深度与颜色数据,既增加计算负担又影响精度。新架构则从底层实现数据对齐,深度信息与色彩信号同步输出,大幅降低后端处理复杂度。这种设计不仅提升数据质量,更使机器人能实时感知环境变化,为物理AI训练提供更精准的输入。

当前机器人感知面临三大挑战:精度不足、环境适应性差、数据采集成本高。杨先声指出,现有3D相机在复杂光照下易失效,分辨率普遍较低,且存在炫光、精度衰减等问题。例如,双目结构光与ToF方案的有效测距通常不超过1米,难以满足机器人多样化操作需求。而激光雷达虽能实现长距离探测,但在近距离高精度场景中仍存在提升空间。

新架构通过SPAD-SoC数字化技术实现硬件级创新。该技术可轻松支持数百线甚至上千线激光雷达,显著提升点云密度。与传统SiPM方案相比,其集成度提高一个数量级,使芯片在性能与成本间取得平衡。这种技术路线已引发行业关注,多家企业开始跟进类似方向。

全栈自研能力构成核心壁垒。从接收芯片到发射驱动,再到系统级优化,研发团队需攻克芯片设计、流片验证、系统调优等多重难关。这种垂直整合模式使产品能精准匹配机器人场景需求,例如在保持小体积低功耗的同时,实现RGB数据与深度信息的像素级融合。

针对数据采集难题,新方案提供突破性解决方案。传统视觉数据因稳定性不足,难以作为训练基准。而高精度三维感知设备可直接获取空间结构与色彩纹理,降低仿真环境搭建难度。多家数据采集企业已与速腾聚创展开合作,通过提升原始数据质量来优化模型训练效率。

在算力优化方面,该架构展现独特优势。传统双目方案需消耗大量资源计算深度,而新设备直接输出融合数据,省去解析环节。这不仅提升帧率、降低延迟,更使末端控制响应更迅速。即使面对高密度点云,用户也可根据需求调整采样率,在精度与效率间灵活选择。

行业转型带来新的市场格局。具身智能对传感器要求远高于自动驾驶,涉及更高维度的感知与控制。许多从智驾领域切入的企业,开始重新评估供应链选择。杨先声认为,这种技术升级将推动上下游协同创新,加速整个生态系统的成熟。

触觉传感成为下一个攻关重点。虽然视觉方案取得突破,但机器人要实现类人操作,仍需解决触觉成本高、可靠性不足等问题。与视觉的非接触特性不同,触觉传感器需直接与环境交互,面临材料磨损、温湿度干扰等复杂挑战,技术难度显著提升。

对于技术路线选择,杨先声强调机器人不应依赖纯视觉方案。人类空间感知本身依赖立体视觉与深度信息,复杂操作场景更需要高精度三维数据支撑。新架构通过融合多模态信号,为机器人提供更接近人类感知方式的解决方案,这种设计理念正获得越来越多企业认可。

ICRA 2026的学术成果持续引发行业关注。会议专题页面已上线重磅论文解读与前沿演讲视频,实时更新现场动态。全球八千名科研人员通过这一平台交流最新突破,共同探索具身智能的技术演进路径。

 
 
更多>同类内容
全站最新
热门内容
本栏最新