当前位置:首页 > 报告详情

杨旭-多模态大语言模型中的上下文学习.pdf

上传人: 张** 编号:182444 2024-10-14 57页 9.93MB

1、多模态大语言模型中的上下文学习杨旭 东南大学演讲嘉宾杨旭东南大学 副教授杨旭博士2021年6月从南洋理工大学计算机科学与技术系获工学博士学位,导师为蔡剑飞,张含望教授。现为东南大学计算机科学与工程学院、软件学院、人工智能学院副教授、任东南大学新一代人工智能技术与交叉应用教育部重点实验室副主任。现主要从事视觉文本多模态大模型应用研究以及一种新的大模型训练-部署模式:学习基因的研究。目 录CONTENTS1.Background2.Heuristic-based configuration strategies3.Learning-based configuration strategiesBac

2、kground“Why do we need In Context Learning?”PART 01The Development of GPTLMICLMultimodal1 Background6GPT(2018)1.5B ParametersPrompt EngineeringGPT-2(2019)175B ParametersIn-context LearningGPT-3(2020)GPT-4(2023)1324DataDataPre-training Fine-tuningPromptImageTextMultimodal VideoIn-contextExamples7GPT-

3、2s Capability of Prompt Engineering l GPT-2 exhibits a distinctive feature known as“prompt engineering”.l This can be compared to the architecture of modern computers,where both data and commands exist in the form of 0s and 1s encoding.LMICL1 BackgroundMultimodal8GPT-3s Capability of In-Context Lear

4、ningl GPT-3 possesses a unique capability known as“In-context learning”.l It will learn the representation of tasks from the provided in-context examples.LMICL1 BackgroundMultimodal9Why In-Context Learning?In-Context Learning Prompt EngineeringYield precise responsesUnlock the potential of LLMsA spe

5、cialized prompt engineeringAdapt to a task using a few examplesfew shotLiu,Pengfei,et al.Pre-train,prompt,and predict:A systematic survey of prompting methods in natural language processing.Dong,Qingxiu,et al.A survey for in-context learning.LMICL1 BackgroundMultimodal10Why In-Context Learning?outsi

6、de-in methodologies to unravel the inner properties of LLMsPros of ICLHow many meters does a 1-kilogram object fall in 1 second?4.9 mObjects fall with a constant acceleration due to gravity,regardless of their mass.What about 10-kilogram?4.9 mProviding incorrect examples does not affect the LLMs abi

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了多模态大语言模型(LMM)中的上下文学习方法。首先,文章介绍了GPT模型的发展历程,从最初的GPT到现在的GPT-4,模型参数和能力不断提升,特别是GPT-3引入了“in-context learning”的能力。接着,文章分析了为什么需要in-context learning,以及其相对于prompt engineering的优势。 然后,文章详细介绍了基于启发式的方法来配置上下文学习,包括图像字幕和视觉问答两个例子。这些方法通过探索不同的上下文配置策略,如随机选择、基于相似性的检索等,来提高模型的性能。 最后,文章探讨了基于学习的方法来配置上下文学习,提出了ICD-LM模型,通过语言建模来学习选择和排列最优的上下文演示。实验结果表明,ICD-LM在配置4-shot ICDs方面表现出色,具有强大的长距离扩展能力。 总的来说,本文深入探讨了多模态大语言模型中的上下文学习方法,包括基于启发式和基于学习的方法,为未来的研究提供了有价值的参考。
上下文学习在多模态大模型中的应用 如何有效配置上下文学习中的图像字幕? 视觉问答中上下文学习的有效策略有哪些?
客服
商务合作
小程序
服务号
折叠