ICRA 2026对话速腾聚创杨先声：为机器人打造精准“慧眼”，开启通用智能新篇

发布时间：2026-06-16 06:41 来源：格隆汇作者：格隆汇

在ICRA 2026的展会上，全球具身智能企业纷纷展示最新技术成果，但一个关键问题却鲜有人提及：机器人至今缺乏真正可靠的视觉系统。这一瓶颈导致机器人难以精准感知三维世界，无法完成精细操作，动作效率远低于人类。为突破这一困境，速腾聚创副总裁杨先声在学术汇报中推出全新视觉感知架构，通过物理层融合深度与RGB信息，为机器人打造更高效的"眼睛"。

传统方案多采用"先采集后融合"模式，需通过算法校准深度与颜色数据，既增加计算负担又影响精度。新架构则从底层实现数据对齐，深度信息与色彩信号同步输出，大幅降低后端处理复杂度。这种设计不仅提升数据质量，更使机器人能实时感知环境变化，为物理AI训练提供更精准的输入。

当前机器人感知面临三大挑战：精度不足、环境适应性差、数据采集成本高。杨先声指出，现有3D相机在复杂光照下易失效，分辨率普遍较低，且存在炫光、精度衰减等问题。例如，双目结构光与ToF方案的有效测距通常不超过1米，难以满足机器人多样化操作需求。而激光雷达虽能实现长距离探测，但在近距离高精度场景中仍存在提升空间。

新架构通过SPAD-SoC数字化技术实现硬件级创新。该技术可轻松支持数百线甚至上千线激光雷达，显著提升点云密度。与传统SiPM方案相比，其集成度提高一个数量级，使芯片在性能与成本间取得平衡。这种技术路线已引发行业关注，多家企业开始跟进类似方向。

全栈自研能力构成核心壁垒。从接收芯片到发射驱动，再到系统级优化，研发团队需攻克芯片设计、流片验证、系统调优等多重难关。这种垂直整合模式使产品能精准匹配机器人场景需求，例如在保持小体积低功耗的同时，实现RGB数据与深度信息的像素级融合。

针对数据采集难题，新方案提供突破性解决方案。传统视觉数据因稳定性不足，难以作为训练基准。而高精度三维感知设备可直接获取空间结构与色彩纹理，降低仿真环境搭建难度。多家数据采集企业已与速腾聚创展开合作，通过提升原始数据质量来优化模型训练效率。

在算力优化方面，该架构展现独特优势。传统双目方案需消耗大量资源计算深度，而新设备直接输出融合数据，省去解析环节。这不仅提升帧率、降低延迟，更使末端控制响应更迅速。即使面对高密度点云，用户也可根据需求调整采样率，在精度与效率间灵活选择。

行业转型带来新的市场格局。具身智能对传感器要求远高于自动驾驶，涉及更高维度的感知与控制。许多从智驾领域切入的企业，开始重新评估供应链选择。杨先声认为，这种技术升级将推动上下游协同创新，加速整个生态系统的成熟。

触觉传感成为下一个攻关重点。虽然视觉方案取得突破，但机器人要实现类人操作，仍需解决触觉成本高、可靠性不足等问题。与视觉的非接触特性不同，触觉传感器需直接与环境交互，面临材料磨损、温湿度干扰等复杂挑战，技术难度显著提升。

对于技术路线选择，杨先声强调机器人不应依赖纯视觉方案。人类空间感知本身依赖立体视觉与深度信息，复杂操作场景更需要高精度三维数据支撑。新架构通过融合多模态信号，为机器人提供更接近人类感知方式的解决方案，这种设计理念正获得越来越多企业认可。

ICRA 2026的学术成果持续引发行业关注。会议专题页面已上线重磅论文解读与前沿演讲视频，实时更新现场动态。全球八千名科研人员通过这一平台交流最新突破，共同探索具身智能的技术演进路径。

更多>同类内容