当前位置:首页 > 报告详情

罗震霄-向量数据库对大语言模型的支持和优化.pdf

上传人: 哆哆 编号:631138 2025-04-19 34页 22.39MB

1、ML-SummitML-Summitwww.cpp-www.ml-summit.orgwww.gosim.orgwww.pm-summit.orgML-SummitML-SummitML-SummitML-SummitML-SummitML-Summit罗罗震震霄霄 P Pi in nt te er re es st t高高级级软软件件工工程程师师Pinterest担任Sr.Staff Software Engineer,负责大数据实时处理引擎,监控平台,和大模型数据预处理。在加入Pinterest之前,罗震霄先后在Cloudera,Uber,Twitter,Facebook负责大数据引擎和机

2、器学习平台的研发和运营工作。罗震霄是开源项目Presto committer,Presto Technical Steering Committee member。本科毕业于复旦大学,博士(on leave)毕业于University of Wisconsin Madiso演演讲讲主主题题:向向量量数数据据库库对对大大语语言言模模型型的的支支持持和和优优化化ML-SummitML-Summit2025 全球机器学习技术大会向量数据向量数据库对库对大大语语言模型言模型的支持和的支持和优优化化罗震霄Sr.Staff Software EngineerPinterestML-SummitML-Sum

3、mit目目录录CONTENTSLanguage Models at PinterestWhy we need VectorDBWhich are the VectorDB options?Our approachML-SummitML-SummitUndergraduate student Fudan University,2003-2007Ph.D.student(on leave)University of Wisconsin Madison,2007-2010Software Engineer Vertica,2010-2011Software Engineer Cloudera,201

4、1-2012Software Engineer Facebook,2012-2013Sr.Software Engineer Netflix,2013-2016Staff Engineer and Engineering Manager Uber,2016-2019Sr.Staff Engineer Twitter,2019-2022Sr.Staff Engineer Pinterest,2022-presentPresto Committer&Technical Steering Committee member,2019-presentML-SummitML-SummitLanguage

5、Models at Pinterest01ML-SummitML-Summit Vector Table Search Text to SQL automated table documentation ads models growth models many moreLanguage Models at PinterestML-SummitML-Summit use generic GPT models from openAI Retrieval Augmented Generation(RAG)Infuse Pinterest context into models both struc

6、tured and un-structured data data documentation slack query historyChallengesML-SummitML-Summit No Coordination manually curated datasets,no data reuse one off solution,no technology reuse embeddings and raw data together Standardization:vectorDB as a serviceMore ChallengesML-SummitML-SummitWhy we n

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
标记的内容中,罗震霄,Pinterest的高级软件工程师,分享了他关于向量数据库对大语言模型的支持和优化的见解。罗震霄提到,Pinterest使用了多种语言模型,包括从OpenAI获取的通用GPT模型,以及Retrieval Augmented Generation (RAG)模型,并把Pinterest的上下文融入到模型中。然而,这些模型面临挑战,如缺乏协调,手动 curated 数据集,无法重用数据,以及向量数据库作为服务标准的缺乏。 罗震霄解释了为什么需要向量数据库(VectorDB),并列举了Pinterest使用的不同数据格式,如CSV,JSON,Sequence File等,以及Parquet的优化方式,如列式读取和字典推导。他指出,尽管Parquet优化了范围扫描,但它不适合向量数据库,因为它在处理向量时效率低下。 在探讨向量数据库选项时,罗震霄提到了LanceDB和Milvus。他认为LanceDB虽然有优化的文件格式,但缺乏数据处理引擎。而Milvus作为一个AI处理引擎,虽然分布式且索引和数据分离,但存在可靠性问题。 最后,罗震霄概述了Pinterest的当前解决方案,包括使用Open search和Elasticsearch进行嵌入计算,以及在StarRocks中进行数据库内向量搜索。他还提到,他们正在朝着构建大规模分布式向量数据库的方向努力。
"Pinterest如何运用向量数据库优化大语言模型?" "罗震霄在Pinterest担任什么职位?他的主要研究方向是什么?" "向量数据库在大数据处理中有什么优势和挑战?"
客服
商务合作
小程序
服务号
折叠