《王炳宁_微信AI搜索Agent的技术实战分享.pdf》由会员分享,可在线阅读,更多相关《王炳宁_微信AI搜索Agent的技术实战分享.pdf(39页珍藏版)》请在三个皮匠报告上搜索。
1、王炳宁腾讯微信Part 01.Part 01.Part 02.Part 02.Part 03.Part 03.简述大语言模型和agent的发展Agent时代微信搜索的Agent迭代展望Agent未来大语言模型和agent的发展基石-语言模型理论奠基与早期实践理论奠基与早期实践核心理论:图灵测试定义智能标准,达特茅斯会议确立AI学科。早期实践:诞生首个基于规则匹配的聊天机器人 Eliza。技术演进:从统计到深度技术演进:从统计到深度 统计语言模型:N-gram 捕捉局部词序特征 分布式表示:Word2Vec(2013)实现高效词向量预训练 循环神经网络:LSTM 网络有效解决长序列依赖问题关键转
2、折点关键转折点(2017)(2017)架架构革命构革命Google 提出Transformer 架构,其“自注意力机制”打破序列壁垒,彻底改变了序列建模方式,成为所有现代大模型的通用基石。GPT-1GPT-1:预训练:预训练+微调微调 NLP NLP范式奠基范式奠基核心参数配置核心参数配置1.17亿参数量,采用12层 Transformer Decoder 结构,奠定基础模型架构。海量无监督训练数据海量无监督训练数据基于 BookCorpus 数据集,包含7000本未出版的无标注书籍,构建通用语言知识。里程碑式核心贡献里程碑式核心贡献首次确立“无监督预训练无监督预训练+下游任务微调下游任务微调
3、”的标准NLP范式,指引后续模型演进方向。GPT-1 GPT-1 核心范式:预训练核心范式:预训练+微调微调海量无标注数据海量无标注数据(BookCorpus)(BookCorpus)7000本电子书,构建通用语言表征Pre-training(Pre-training(预训练阶段预训练阶段)学习语言统计规律,获得通用模型参数Task Fine-tuning(Task Fine-tuning(任务微调任务微调)适配下游具体任务,输出精准结果适配下游具体任务,输出精准结果大语言模型与Agent发展:GPT系列自回归语言模型的表示建模能力第一次在通用任务上被验证。OpenAI走上了scaling的路
4、线。GPT-2 2019 GPT-2 2019 模型初显模型初显核心规模:1515亿参数亿参数|算力与数据的初步跃升能力突破:Zero-Shot Zero-Shot 零样本生成零样本生成,无需任务微调文本表现:长文本连贯输出连贯输出,语义理解与生成更流畅GPT-3 2020 GPT-3 2020 能力爆发能力爆发规模质变:17501750亿参数亿参数|涌现出极强的通用能力范式革新:上下文学习上下文学习(ICL)(ICL),开启提示词驱动时代核心痛点:无人类对齐无人类对齐,交互不可控、易产生幻觉模型参数量爆发式增长对比模型参数量爆发式增长对比(单位:亿单位:亿)大语言模型与Agent发展:GPT
5、系列通过人类反馈强化学习,解决了大模型“能算不能用”的痛点,实现自然交互。2022.11.30 OpenAI正式发布,以对话式交互开启了生成式AI的全球浪潮。基于通用的自然语言,没有专项的任务设定和优化,基于大语言模型的泛化能力完成各种任务核心突破:RLHF 人类对齐发布时间:AI全民化引爆模型到应用:通用自然语言接口大语言模型与Agent发展:GPT系列From Chatbot to Agenthttps:/ Chatbot to AgentAgent时代的几个代表产品:基础档案基础档案 研发主体:研发主体:Butterfly EffectButterfly Effect2025.12 被
6、Meta 以 20-30 亿美元全资收购,并入生态正式发布:正式发布:2025.03.062025.03.06全球范围内同步上线,开启通用执行时代定位:定位:端到端通用执行智能体端到端通用执行智能体“手脑并用”的任务交付者,深度理解意图并自主执行SloganSlogan:从:从“给建议给建议”到到“交成果交成果”,零人工干预零人工干预关键里程碑关键里程碑/KEY MILESTONES/KEY MILESTONES2025.03 2025.03 爆发期爆发期正式版上线仅 4 小时,全网访问量突破 1000 万,引发行业震动。2025.06 2025.06 商业化商业化To B 订阅服务快速铺开,