1、TableGPT-大模型的漫长落地之路初探赵俊博 浙江大学演讲嘉宾赵俊博(Jake)浙江大学百人计划研究员浙江大学计算机学院百人计划研究员、博士生导师浙江大学图灵班项目主任浙江大学计算机创新技术研究院 人工智能前沿中心主任前连续创业者,前 Facebook,前 NVIDIA纽约大学博士,师从图灵奖得主 Yann LeCun福布斯30Under30科技赛道封面人物,阿里云MVP,百度青年 AI 学者,首届 WAIC 青年科学家TableGPT:将表格、自然语言和命令统一为一个 GPT预训练大语言模型(LLM)的高速发展革新了人机交互、信息获取的方式,但是 LLM 在面对精准定量问题中展现出来的“
2、刚性”和准确性仍然差强人意。在本次报告中,我们介绍TableGPT,一个融合自然语言交互、对结构化数据的向量化理解和交互链式指令集的完备系统,在落地场合中通过与用户进行自然语言交互实现对表格文件或者数据库表的增删改查和其他复杂操作,兼容自动化大小模型交互,并支持可视化图表生成和简单的报告撰写。团队介绍科研支持M3实验室 实验室主要研究方向包括Data-centric AI、AI+X交叉、预训练大模型与AIGC等课题。实验团队在NIPS、ICLR、ICML等顶会每年发表论文10余篇,多次获得best paper,多次在Nature等著名期刊发表论文。工业落地支持浙江大学计算机创新技术研究院研究院
3、旨在打造数字经济人才聚集地,做培育科技企业的“创新加速器”,将在资本、技术、人才、场地等各维度赋能企业,加速企业孵化,打造创新与创业相融合的新样板窗口。硬件支持中昊芯英(杭州)有限公司中昊芯英构建了“自研训练芯片+超算集群+AIGC 预训练大模型”的产业价值链,打造完整的软硬件一体化方案,为全球客户提供具备生产变革能力的人工智能创新技术方案,加速人工智能的工程落地与产业化进程目 录CONTENTS1.研究背景2.Table GPT功能展示3.关键技术4.TableGPT落地案例5.总结与展望研究背景PART 01给一个灵魂拷问针对LLM现状的思考:柔性和刚性为什么我们要做一个刚性的LLM我们要
4、做一个什么样的刚性LLM给一个灵魂拷问:你会为一个闲聊的玩具买单吗?可能,我们至死是少年 所以还是会的但是针对LLM现状的思考:柔性和刚性针对LLM现状的思考:柔性和刚性ChatGPT系列等错了就错了,无所谓!目的是提高人机交互体验柔性LLMTableGPT严格、严谨不能出错刚性LLM什么是LLM的柔性和刚性?针对LLM现状的思考:柔性和刚性对于一个柔性 LLM 的产品价值分析,产品边际价值=新产品价值 旧产品价值 切换成本(产品方法论)真正最大化产品边际价值的方式就是 把这个SQL专家 换成不懂SQL的人,同时确保刚性而这,就是TableGPT做的事SQL expertLLMSQLexper
5、tprompt请分析单品均价和卖出数量之间的关系新产品价值:SQL专家写 prompt,通过LLM得到SQL,然后必须由专家修正并确保刚性旧产品价值=SQL专家直接写SQL!刚性SQL code举一个NL2SQL的例子来分析一个柔性LLM的产品价值为什么我们要做一个刚性的LLM?因为,文理需要兼修为什么我们要做一个刚性的LLM“理科生”刚性LLM能做的“文科生”柔性LLM能做的文科生通常更注重人文关怀和感性理解,而理科生则更注重逻辑推理和理性分析。聊天对话文本生成内容摘要协助编程分析、生成报告辅助决策数据可视化自动建模预测我们要做一个什么样的刚性LLM在对话基础上,具备普适性业务数据处理能力,
6、而表格是我们日常实用的数据格式,并且数据库是各处都有的基础设置 所以我们要做一个能用自然语言对话、能处理表格并具备刚性的LLM对话能力是刚性LLM的基础我们要做一个什么样的刚性 LLM我们要做一个什么样的刚性LLMEveryone!企业管理者、数据分析师、学生零门槛让你玩转表格&数据库类产品能做什么?一款可以读懂表格的 LLM,可以根据表格内容聊天以完成工作的伙伴谁能用?我们要做一个什么样的刚性LLM实现一个刚性LLM的初步思路INPUT指令精调输入映射DSL领域限定语言功能分发OUTPUTLLM为什么是TableGPT?如GPT plugins-Show me diagrams 其能够完成面