当前位置:首页 > 报告详情

初佳明-DeepSeek R1技术复现和大模型的治理与安全.pdf

上传人: 哆哆 编号:631170 2025-04-19 43页 19.72MB

1、ML-SummitML-Summitwww.cpp-www.ml-summit.orgwww.gosim.orgwww.pm-summit.orgML-SummitML-SummitML-SummitML-SummitML-SummitML-Summit初初佳佳明明 北北京京邮邮电电大大学学博博士士生生,T Te el le eA AI I研研究究院院A AI I治治理理实实习习生生北京邮电大学电子工程学院博士在读。研究方向聚焦于无训练的可控图像编辑生成和 AI 图像鉴伪。论文被ACM MM、IEEE TIP等CCF-A会议期刊收录,在 CVPR2022 SoccerNet workshop

2、竞赛中的Replay Grounding Track夺冠。具有大语言模型垂类领域微调经验,对信号处理、图像处理、表征学习、自然语言处理和提示词工程都有较深的研究经验。目前在中国电信人工智能实验室多媒体认知学习实验室做实习生,研究方向目前涉及镜头可控的视频生成、生成图像鉴伪和AI治理。演演讲讲主主题题:D De ee ep pS Se ee ek k R R1 1技技术术复复现现和和大大模模型型的的治治理理与与安安全全ML-SummitML-Summit2 20 02 25 5 全球机器学习技术大会D De ee ep pS Se ee ek k R R1 1技技术术复复现现和和大大模模型型的的

3、治治理理与与安安全全初佳明TeleAI of China Telecom中国电信人工智能研究院EVOL LabML-SummitML-Summit目目录录DeepSeek-R1 技术复现及分析针对大语言模型的红队攻击AI的安全与治理ML-SummitML-SummitDeepSeek-R1 技术复现ML-SummitML-Summit通通用用模模型型:DeepSeek LLM(V1):Scaling Open-Source Language Models with Longtermism(2024.1.5)D De ee ep pS Se ee ek k L LL LMM包包含含7 7B B&

4、6 67 7B B参参数数(D De en ns se e),从零开始在一个包包含含2 2万万亿亿t to ok ke en n的的数数据据集集上上进进行行了了训训练练,数据集涵盖中英文。参与研发人员(作者)8 86 6人人DeepSeek-V2:A Strong,Economical,and Efficient Mixture-of-Experts Language Model(2024.5.7)D De ee ep pS Se ee ek k-V V2 2是是一一个个混混合合专专家家(MMo oE E)语语言言模模型型,它它包包含含2 23 36 60 0亿亿个个总总参参数数,其其中中每每

5、个个t to ok ke en n激激活活2 21 10 0亿亿个个参参数数,在在8 8.1 1万万亿亿t to ok ke en ns s语语料料库库上上进进行行了了预预训训练练。与DeepSeek 67B相比,DeepSeek-V2不仅实现了更强的性能,同时还节省了42.5%的训练成本,将KV缓存减少了93.3%,并将最大生成吞吐量提升至5.76倍。参与研发人员(作者)1 15 56 6人人DeepSeek-V3:A Breakthrough in Inference Speed and Performance(2024.12.26)D De ee ep pS Se ee ek k-V V

6、3 3是是一一个个强强大大的的混混合合专专家家(MMo oE E)语语言言模模型型,总总参参数数为为6 67 71 10 0亿亿,每每个个t to ok ke en n激激活活3 37 70 0亿亿参参数数,基基于于 1 14 4.8 8T T t to ok ke en ns s 训训练练。为了实现高效的推理和经济高效的训练,DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeek MoE架构。参与研发人员(作者)2 20 00 0人人专专用用模模型型:DeepSeekMath:Pushing the Limits of Mathematical Reasoning in Op

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了DeepSeek系列模型的发展历程,包括通用模型和专用模型。通用模型包括DeepSeek LLM、DeepSeek-V2和DeepSeek-V3,它们在参数数量、训练数据和性能上都有显著的提升。专用模型包括DeepSeekMath、DeepSeek-Coder和DeepSeek-Coder-V2,它们在数学推理、编程和代码智能方面有较强的能力。此外,文章还介绍了DeepSeek-R1模型,它是基于DeepSeek-V3采用Reasoning方式基于强化学习训练的复杂推理模型,在很多任务场景效果超过O1。文章还讨论了针对大语言模型的红队攻击,以及AI的安全与治理,包括内生安全、衍生安全和社会伦理等方面。
如何确保大模型在遭遇攻击时仍保持可信度? 如何评估和消除AI系统扩展带来的社会不公平和歧视? 如何构建大模型安全高质量评估体系?
客服
商务合作
小程序
服务号
折叠