当前位置:首页 > 报告详情

王鹏伟-智源具身智能核心:大小脑操作框架与具身大脑模型构建.pdf

上传人: 哆哆 编号:631168 2025-04-19 29页 13.53MB

1、ML-SummitML-Summitwww.cpp-www.ml-summit.orgwww.gosim.orgwww.pm-summit.orgML-SummitML-SummitML-SummitML-SummitML-SummitML-Summit王王鹏鹏伟伟 智智源源具具身身智智能能大大模模型型负负责责人人,R Ro ob bo oB Br ra ai in n与与R Ro ob bo oO OS S负负责责人人北京智源人工智能研究院具身智能大模型负责人、目前主要负责具身大脑大模型RoboBrain以及大小脑框架RoboOS,研究方向是具身智能、多模态大模型、深度学习、自然语言处理和机

2、器学习等方向,曾就职于阿里巴巴达摩院以及快手科技大模型中台部门,主要负责大规模语音语义一体化等多模态交互系统以及多模态预训练项目,具有丰富的多模态大模型、文本大模型以及机器智能等产学经验,在相关领域顶级会议上发表过数十篇会议论文。演演讲讲主主题题:智智源源具具身身智智能能核核心心:大大小小脑脑操操作作框框架架与与具具身身大大脑脑模模型型构构建建ML-SummitML-Summit具身智能跨本体框架RoboOS与具身大脑RoboBrain智源 具身智能大模型研究中心王鹏伟ML-SummitML-Summit人工智能趋势分析1950196019701980199020002023202420252

3、006AI 1.0(Small Models)PerceptronExpert SystemBP AlgorithmXCON&MYCIN Expert Systems Become Commercially AvailableExpert SystemPC(Cost/Application Scope)ChatGPTGPT-3TransformerCommercial FactorsTechinical FactorsAI 2.0(Large Models)AI 1.0 Commercialization bottlenecksAI诞生First WaveSecond WaveThird Wa

4、veGPT-4GPT-4VGeminiSoraGPT-4oRT-2Dartmouth ConferenceEmbodied AI as the Next GPT Moment in AISORA(2024)ChatGPT(2023)AlexNet(2012)DNN(2006)Embodied AI will become the core driving force of AI technology development over the next decade,leading to new revolutionary products and reshaping industry land

5、scapes.Figure from BAAIML-SummitML-Summit具身智能趋势分析Single TaskSingle Ontology,Single ScenarioAI 1.0 ME 1.0Hand-Eye Coordination Robotic ArmLarge ModelBig DataRobot BrainAI 3.0+ME 3.0+General Intelligence SystemsMultiple Ontologies,Multiple ScenariosEnd-to-End Multimodal Large Model RoboticsIntelligent

6、 Robots Integrating Perception,Grasping,and Mobility2023 and Earlier2024Post-2025Multiple TasksSingle Ontology,Single ScenarioAI 2.0 ME 2.0Intelligent RobotsPerception&UnderstandingTask Decision-MakingExecution&Collaboration Evaluation&FeedbackScaling LawProven Accuracy in Large Language Models and

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了北京智源人工智能研究院研发的具身智能大脑大模型RoboBrain,该模型通过多模态感知与抽象指令理解能力,输出原子任务规划、可操作区域和操作轨迹,实现从感知到认知再到决策和控制的闭环。RoboBrain的研究重点是开发具备跨本体、可泛化的具身智能大脑大模型,以解决端到端模型在泛化性和扩展性方面的局限。文章还提到了RoboBrain在任务规划、可操作区域感知和轨迹预测等方面的卓越性能,以及在三个具身任务规划基准中的优异表现。此外,本文还介绍了RoboBrain的训练策略和训练数据,以及其在真实场景中的应用案例。最后,文章提到了RoboBrain和ShareRobot数据集的全开源情况,为机器人操作任务提供了高质量的异构数据集。
"具身智能大脑模型RoboBrain的创新之处在哪里?" "如何通过大小脑模型协同框架实现具身智能体的通用性?" "ShareRobot数据集对RoboBrain模型的训练起到了什么作用?"
客服
商务合作
小程序
服务号
折叠