报告预览

北京大学：2025年DeepSeek原理和落地应用报告（57页）.pdf

编号：616490

PDF PPTX 57页 9.55MB 下载积分：VIP专享

下载报告请您先登录！

北京大学：2025年DeepSeek原理和落地应用报告（57页）.pdf

1、DeepSeek原理与落地应用AI肖睿团队（孙萍、吴寒、周嵘、李娜、张惠军、刘誉）2025年03月01日厦门大学大数据百家讲坛北大青鸟人工智能研究院北大计算机学院元宇宙技术研究所北大教育学院学习科学实验室7 人工智能概念辨析人工智能概念辨析DeepSeek R1大模型原理大模型原理落地应用落地应用目目录录C O N T E N T S人工智能概念辨析人工智能概念辨析PART 01大模型相关术语l 多模态文本、图片、音频、视频l AI工具（国内）DeepSeek、豆包、Kimi、腾讯元宝、智谱清言、通义千问、秘塔搜索、微信搜索.l 通用模型大语言模型（LLM，Large Langua

2、ge Model）视觉模型（图片、视频）音频模型多模态模型 l 行业模型（垂直模型、垂类模型）教育、医疗、金融等大模型的前世今生人工智能人工智能：让机器具备动物智能，人类智能，非人类智能（超人类智能）运算推理：规则核心；自动化知识工程：知识核心；知识库+推理机机器学习机器学习：学习核心；数据智能（统计学习方法，数据建模）常规机器学习方法：逻辑回归，决策森林，支持向量机，马尔科夫链，.人工神经网络人工神经网络：与人脑最大的共同点是名字，机制和架构并不一样传统神经网络：霍普菲尔德网络，玻尔兹曼机，.深度神经网络：深度学习深度学习传统网络架构：DBN，CNN，RNN，ResNet，Incepti

3、on，TransformerTransformer架构架构：可以并行矩阵计算（GPU），核心是注意力机制（Attention）编码器（BERT）：多数embedding模型，Ernie早期版本，.混合网络：T5、GLM解码器（GPTGPT）：大语言模型（大语言模型（LLMLLM），也是传统的多模态模型的核心生成式人工智能生成式人工智能（GenAIGenAI）：）：AIGCAIGCDeepSeekDeepSeek、Qwen、GLM、Step、MiniMax、hunyuan、kimi、OpenAI GPTOpenAI GPT（ChatGPTChatGPT）、Claude、Llama、Grok、Di

4、ffusionDiffusion架构架构：主要用于视觉模型（比如Stable Diffusion、DALLE），现在也开始尝试用于语言模型Diffusion+Transformer架构：例如SoraSora的DiT（加入Diffusion的视觉模型），部分新的多模态模型架构大模型的发展阶段生成模型ref:中文大模型基准测评2024年度报告(2025.01.08)推理模型生成模型与推理大模型的对比比较项OpenAI GPT-4o（生成模型）OpenAI o1（推理模型）模型定位专注于通用自然语言处理和多模态能力，适合日常对话、内容生成、翻译以及图文、音频、视频等信息处理、生成、对话等。侧重于复杂

5、推理与逻辑能力，擅长数学、编程和自然语言推理任务，适合高难度问题求解和专业领域应用。一般是在生成模型的基础上通过RL方法强化CoT能力而来推理能力在日常语言任务中表现均衡，但在复杂逻辑推理（如数学题求解）上准确率较低。在复杂推理任务表现卓越，尤其擅长数学、代码推理任务。多模态支持支持文本、图像、音频乃至视频输入，可处理多种模态信息。当前主要支持文本输入，不具备图像处理等多模态能力。应用场景适合广泛通用任务，如对话、内容生成、多模态信息处理以及多种语言相互翻译和交流；面向大众市场和商业应用。适合需要高精度推理和逻辑分析的专业任务，如数学竞赛、编程问题和科学研究；在思路清晰度要求高的场景具有明显优

6、势，比如采访大纲、方案梳理。用户交互体验提供流畅的实时对话体验，支持多种输入模态；用户界面友好，适合大众使用。可自主链式思考，不需要太多的过程指令，整体交互节奏较慢。D e e p S e e k R 1PART 02DeepSeek公司2025年1月20日推出DeepSeek-R1推理模型作为由知名私募巨头幻方量化孕育而生的公司，DeepSeek获得了强大的资金支持和行业影响力，幻方量化与九坤投资、明汯投资、灵均投资并称量化私募领域的“四大天王”，管理资金规模均超过600亿元。这为DeepSeek提供了清晰的市场定位和投资者背景DeepSeek专注于开发先进的大语言模型(LLM)和相关技术，

友情提示

1、下载报告失败解决办法
2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。
3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

本文（北京大学：2025年DeepSeek原理和落地应用报告（57页）.pdf）为本站（蒸蒸日上）主动上传，三个皮匠报告文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三个皮匠报告文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。