《曾书霖-AI 2.0 时代的大模型推理:从模型到硬件的协同优化_终稿.pdf》由会员分享,可在线阅读,更多相关《曾书霖-AI 2.0 时代的大模型推理:从模型到硬件的协同优化_终稿.pdf(58页珍藏版)》请在三个皮匠报告上搜索。
1、AI 2.0 时代的大模型推理:从模型到硬件的协同优化曾书霖目录0102030405以智能革命 引领大模型推理范式变革以弹性算力集群 驱动云侧智能升级面向华为昇腾的推理优化部署实践以有限算力架构 释放终端应用潜能以大模型推理技术创新 融合人工智能产业创新01以智能革命 引领大模型推理范式变革以人工智能为代表的第四次工业革命(智能革命)极大提升人类生产力以人工智能为代表的第四次工业革命(智能革命)极大提升人类生产力1800182518501875190019251950197520002025第一次第一次 机械革命机械革命第二次第二次 电气革命电气革命第三次第三次 数字革命数字革命世界GDP增速
2、世界GDP总量Future第四次第四次 智能革命智能革命蒸汽机蒸汽机电力电力信息技术信息技术人工智能人工智能解放农业生产力加速工业发展提升各产业生产力智能化应用创造价值智能化应用创造价值体力密集型生产组装一辆汽车/人日体力密集型生产生产100米布/人日创造性劳动药物发现未知时间月量级重复性脑力工作100阶线性方程组求解1800人小时0.05人小时生产工具与驱动方式的创新生产工具与驱动方式的创新创造性劳动智能革命蒸汽机蒸汽动力体力重复劳动机械革命火电动力内燃机流程化劳动电气革命知识管理劳动知识信息互联网数字革命人类生产力水平与认知边界不断突破工业革命工业革命工具创新工具创新替代劳动替代劳动驱动方
3、式驱动方式智能算法智能算法半导体芯片半导体芯片模型推理:技术协同的中枢与产业价值的放大器模型推理:技术协同的中枢与产业价值的放大器创造性劳动智能革命智能算法半导体芯片模型训练模型训练替代技术协同的中枢技术协同的中枢产业价值放大器产业价值放大器推理框架用户请求调度端侧设备计算图优化算子优化调度优化云平台模型压缩模型推理“人工智能“人工智能+”制造”制造“人工智能“人工智能+”金融”金融“人工智能“人工智能+”能源”能源“人工智能“人工智能+”医疗”医疗 自自20122012 年以来生成模型发展的关键节点年以来生成模型发展的关键节点20172017年谷歌提年谷歌提出出TransformerTran
4、sformerTransformer架构奠定了LLM基础,开启大模型时代20192019年谷年谷歌提出歌提出T5T5架构架构验证Text-to-Text范式在NLP任务中的通用性20202020年年OpenAIOpenAI提出提出GPTGPT-3 3展示LLM强大的的少样本学习能力,引发业界对大模型的研究热潮20232023年年OpenAI OpenAI ChatGPTChatGPT爆火爆火引爆全球生成式AI应用,标志AI进入大规模普及阶段201720162016年商汤、旷世崛起年商汤、旷世崛起以计算机视觉技术为核心,推动AI在安防等领域的落地201920252022智谱推出智谱推出ChatG
5、LMChatGLM第一个国产大模型20252025年年DeepSeekDeepSeek开源开源R1R1推理模型推理模型比肩OpenAI O1算法性能的同时,成本仅为5%10%202020212021年百度推年百度推出出ERNIEERNIE-3.03.0在多项NLP任务中超越GPT-320232021202420222022年年OpenAI OpenAI InstructGPTInstructGPT提出利用RLHF讲LLM与人类对齐,ChatGPT的基础20242024年年OpenAI OpenAI SORASORA爆火爆火火爆全球的视频生成软件,首次实现1分钟长视频的生成,且画面一致性较高20
6、242024年年OpenAI OpenAI 提出提出O1O1系列模型系列模型将长思维链推理技术带入主流,总结TestTime Scaling,显著提升模型的推理能力20242024年生数推年生数推出出ViDUViDU生数科技发布国内首个文生视频模型,距离Sora发布仅2个月阿里通义千问阿里通义千问开源开源后续逐步成为继Meta Llama之后的全球第二大大模型开源模型及生态20232023年年MetaMeta开源开源LlamaLlama后续逐步成为全球第一大大模型开源模型及生态百模大战百模大战国内多家公司相继发布自研大模型,API服务价格降低10倍以上国国外外标标志志性性节节点点国国内内标标志