《华为云CloudRobo加速具身智能创新发展.pdf》由会员分享,可在线阅读,更多相关《华为云CloudRobo加速具身智能创新发展.pdf(12页珍藏版)》请在三个皮匠报告上搜索。
1、CloudRobo:让智能在云端无限进化周顺波华为云物理智能创新Lab负责人具身智能的 ChatGPT 时刻会到来吗?AI正从判别式、生成式发展到物理智能AI的发展路径正在从以识别、生成信息为主,走向控制实体设备(如汽车、机器人)在现实世界中行动AI技术经历从学术研究(左岸)到规模应用(右岸)的跨越AI技术从学术界积累(如Transformer),标志性成果(如ChatGPT-3.5)出现,跨越鸿沟走向大规模商业应用VLA研究激增,推进走向具身Chatgpt时刻2024年以来,VLA研究激增,技术飞速演进,业界判断具身智现“ChatGPT时刻”临近判别式AI生成式AI物理智能LLM&VLM当前
2、产业泛具身未来产业 SayCan,22.08 Code as Policy,22.09 Palm-E,23.03 Voxposer 23.07 DriveVLM,24.02 Blip2,23.01 Llava,23.04Alexnet开启深度学习时代Sora开启VGM时代谁将开启VLA时代?Transformer,17.0620122024.22022.112023.9 ResNet,15.12 Yolo,15.12 Bert,18.10 GPT-3,20.05 PaLM 22,04 LLAMA Grok Gemini 1.0 Qwen 23操作 RT-2 23.07移动DriveGPT4 2
3、3.10 Gemini 2.0,24.12 Qwen2-VL 24.08 Claude 3 GPT4o Llama 3 DeepSeekV3 LDM,21.12 DiT,22.12操作 UMI 24.02 3D-VLA,24.03 OpenVLA,24.06 Pi0,24.10 RDT,24.10 Navila,24.12移动 NWM,24.12操作 Helix,25.02 Gr00T N1,25.03 Gemini Robotics,25.03 Pi 0.5,25.04 RoboBrain2,25.072012-20172018-2022202320242025文生文(LLM)图生文(VLM
4、)文生图/视频(AIGC)DeepSeek R1 Kimi v2空间智能(理解物理空间)具身智能(规划行动,VLA)世界模型(推理预测长序物理过程)左岸:技术积累右岸:规模应用 Yolo v3,18.04 ViT 20.10 Clip 21.02Flamingo,22.04 Veo 3,25.05 可灵2.0,25.04 3D-LLM 23.07 Qwen2.5-VL 25.01感知端到端 ADS 2.0,23.07 XNGP 23.03 AD 全端到端(移动)Simlingo 25.03 DALLE-3 MidJorneyGPT-4V开启VLM时代ChatGPT 3.5开启大模型时代2026
5、 模块化智驾 FSD 2020.10 ADS 2021 BevFormer 22.03 Occupancy,2022 GoD 23.06具身智能行业,华为云在哪里?足式机器人仓储机器人无人机医疗机器人机器人仿真运行管理机器学习计算机视觉企业客户解决方案集成机器人制造商软件技术硬件模组提供商2B/2G电力、安防巡检家用、商用清洁园区、餐厅递送智慧仓储手术医疗轮式机器人主操作系统机器人操作系统机械臂电机减速器舵机激光雷达视觉传感器建图配件计算IMU移动底盘三维重建部分厂商会基于ROS进行定制开发,但无法形成生态渲染引擎机器人行业现状CloudRobo:端云协同驱动具身Agent自主学习,低人工,低
6、门槛,可复制效率低单个Skill(比如视觉伺服定点停靠)调参+测试,耗时以天计;一个自主机器人系统通常由数十甚至上百个Skill组成;Skill之间通常耦合严重,系统集成&联调过程不确定性高,耗时以月计;泛化难当前单个Skill通常针对限定场景调参,比如办公室的AB点导航问题,难以直接适配到室外园区当前应对corner case,通常是以人工手写应对规则为主,难以自动化,难以泛化推广到其它场景门槛高写Skill代码、集成、测试、部署、补丁优化等环节均需要专业人员投入真实数据示教+重建,仿真合成场景任务,技能主动学习,开发运行数据闭环,零人工、低门槛虚拟世