1、杨强 202307杨强微众银行首席人工智能官(CAIO)加拿大工程院与皇家学院院士2024.42目录AI Agent是大模型面向应用端发展的下一阶段WeBank AI Agent联邦学习与联邦大模型32.通用大模型不具备专业知识通用大模型不能直接应用1.通用大模型存在幻觉问题3.保护数据要素隐私大模型生成的回复违背了用户输入中的任务指示或者任务输入;大模型生成的回复出现了自我矛盾;大模型生成的回复与公认的事实知识出现了冲突。需要不断增加高质量的标注数据,优化模型加以解决通用大模型如直接用于各行各业,模型表现得专业知识不足,并不能满足业务要求;需要利用本地数据训练垂类行业大模型,大幅度提升模型性
2、能机器学习项目中不同环节耗费时间结构比重对数据相关的处理过程可占据超过 80%的时间,其中数据标注环节的耗时占比可达 25%数据标注25%数据整合10%数据清洗25%数据识别5%机器学习模型训练10%机器学习算法开发3%数据增强15%机器学习模型调参5%机器学习模型实现2%例子:问:请总结以下新能源车的介绍,并突出说明其优点。答:总体上看,这款最新的XXX车性能优异,尤其是其续航里程达到了2千公里。训练垂类行业模型时,面临保护各类本地数据隐私的问题。包括,训练数据,本地模型,提示词等。多个数据源联合训练一个大模型时极有可能会暴露每个数据源的用户隐私和影响信息安全。4AI Agent如何解决通用
3、大模型短板知识库检索增强生(RAG)办法:1.收集整理垂类相关的领域数据/企业数据/专业数据;2.构建垂直行业领域的知识库。效果:1.知识库反馈的信息,保证事实正确,避免了幻觉;2.实时查询,避免了信息滞后。5AI Agent如何解决生成式大模型短板大模型微调(Finetune)方案:1.收集整理垂类相关的领域数据/企业数据/专业数据;2.利用这些数据修正(微调)大模型;效果:1.微调后的大模型,更理解垂类应用要求,性能更优;2.微调后的大模型,事实性更准确,避免了幻觉。通用大模型Embedding模型人工审核Prompt优化、反面案例、COT构建模型微调性能评估垂直领域文档原始训练集审核后训
4、练集专用训练集微调后模型模型上线6微调数据(思维链)微调效果:AI Agent如何解决生成式大模型短板大模型微调(思维链 CoT)方案:1.微调数据中包括领域知识及解题步骤(思维链);2.利用这些数据修正(微调)大模型;效果:1.微调后的大模型,更理解垂类应用要求,性能更优;2.微调后的大模型,事实性更准确,避免了幻觉。7AI Agent如何解决原生大模型短板联邦大模型方案:1.构建联邦大模型新范式,解决数据稀缺/标注不足问题;2.利用联邦学习技术,在保护数据隐私的前提下,合规合法地利用手机、汽车等终端设备上的私域数据;效果:1.联邦大模型,整体性能更优;2.联邦大模型,有效保护了私域数据的隐
5、私和机密。3.本地的联邦模型,无需高性能计算资源,降低了使用门槛,提升了能源效率。8AI Agent是大模型面向应用端发展的下一阶段AI Agent:面向某一特定任务/场景,提供解决方案的智能助手大模型能力AI Agent特定任务/场景的数据撰写文章能力专利场景:撰写技术交底书AI Agent专利助手示例9AI Agent是大模型面向应用端发展的下一阶段AI Agent的特点基于大模型的通用能力结合领域知识,适应不同的场景需求AI Agent与大模型的关系 大模型只是一种通用能力 AI Agent是在大模型通用能力上定制化的落地解决方案,和业务直接对接Lilian Weng(OpenAI Sa
6、fety团队负责人)AI Agent可以让LLM从“超级大脑”进化为人类的“全能助手”,这意味着基于LLM的Agent助手以后将会服务更多的人与组织。比尔盖茨(微软联合创始人)Agent更加智能。它们是主动的,能够在你提出请求之前就提供建议;能够跨应用程序执行任务;能够随着时间推移而改进。李彦宏(百度创始人、董事长兼首席执行官)大模型时代,真正最大的机会既不在基础服务,也不在行业服务,我觉得恰恰是在应用。马克扎克伯格(Meta CEO)AI助手(Agent)可以帮助人们创造内容来更好地表达其想法,或者成为给用户建议和鼓励的AI教练。10目录AI Agent是大模型面向应用端发展的下一阶段WeB