1、AI 时代下的企业人才管理体系彭靖田谷歌 AI 开发者专家上海载极数据科技 创始人/CEOAbout me-彭靖田,谷歌出海创业加速器导师,加州大学访问学者-连续创业者:才云科技AI技术合伙人(20年字节全资收购),品览联合创始人兼CTO(23年股权退出),上海载极数据(24年)提供AI智能体开发,大模型微调和企业咨询服务。-开源贡献者:Kubeflow/TensorFlow/Kubernetes-行业布道者:Linux CNCF 程序委员会成员,大模型开发/微调训练和深度学习课程学员 10万+目录DeepSeek 爆火的现象与本质创新实践:企业如何重构人才价值链拥抱未来:AI 时代企业人才管
2、理体系DeepSeek 有多火?2月17日,中共中央总书记、国家主席、中央军委主席习近平民营企业座谈会。DeepSeek 梁文锋出席。1月20日,中共中央政治局常委、国务院总理李强总理座谈会。DeepSeek 创始人梁文锋出席并发言。能力突破:推理大模型 No.1全球大模型领跑者:DeepSeek R1 模型赶超 OpenAI o1,拥有最强推理能力。开源:技术共享,生态共建大模型标准制定者:公开技术原理(论文),开源全部代码和模型,建立大模型训练标准和方法论。低成本:开启普惠企业级Al应用训练成本仅550万美金:显著低于行业同类模型(6000 万美金),打破高价壁垒推理成本降低83%:加速商
3、业化落地,开发者可快速构建教育、金融、医疗等垂直领域应用 国产化:100%技术自主可控突破“卡脖子”技术瓶颈:将国产模型与美国的代际差距从3-5年追平,部分能力赶超。带动国产半导体产业智能化升级,典型如:华为昇腾,沐曦 GPU(已完成上市辅导)。为什么火:能力突破、开源、低成本、国产化DeepSeek vs 其他大模型DeepSeek 技术演进与战略布局 DeepSeek V1:验证 LLaMA 工作,提出超参数幂律关系公式 DeepSeek V2:提出多头潜在注意力机制(MLA)与 DeepSeekMoE 架构 DeepSeek V3:提出无辅助损失负载均衡策略与多 Token 预测(MTP
4、)DeepSeek R1:追平 OpenAI o1,全球首个基于强化学习训练的推理大模型DeepSeek V2 横空出世(2024 年 5 月)提出 MLA 与 DeepSeekMoE 架构,大幅降低训练成本,提升模型性能DeepSeek V2 横空出世(2024 年 5 月)DeepSeek V3 引领开源大模型(2024 年 12 月)DeepSeek V3 BenchmarkDeepSeek R1 赶超 OpenAI o1(2025 年 1 月)模型名称用途特点类型DeepSeek-R1-Distill-Qwen-1.5B个人开发、学术研究部署成本低、能力有限蒸馏模型(小尺寸)DeepS
5、eek-R1-Distill-Qwen-7BDeepSeek-R1-Distill-Llama-8BDeepSeek-R1-Distill-Qwen-14BDeepSeek-R1-Distill-Qwen-32B商业化产品开发集成成本适中,中文场景能力强蒸馏模型(最大尺寸)DeepSeek-R1-Distill-Llama-70B成本偏高,中文能力差蒸馏模型(最大尺寸)DeepSeek-R1-67IB政府和国央企等综合应用成本高,最接近通用人工智能满血版DeepSeek R1 全家桶开源模型对比DeepSeek-V3-0324较之前的版本增加了60%的专家(从160增加到256),使用了FP8
6、精度训练将计算效率翻倍,不仅使前端编码能力增强,数学与逻辑能力也有所提升。DeepSeek 更新 V3 基座模型,大幅提升编程能力(2025年3月24日)DeepSeek-V3-0324 跃居非推理类模型榜首,甚至超越了 Claude Sonnet 3.7(闭源商业模型)。DeepSeek 更新 V3 基座模型,大幅提升编程能力(2025年3月24日)3月25日,Google 发布 Gemini 2.5 Pro,实力超群Gemini 2.5 Pro 图像编辑能力引发关注3月25日,GPT-4o 迎来大更新,花样玩法层出不穷GPT-4o 在 LMSYS 跃升到第二多模态原生支持:可处理文本、图像