《杨扬_GenAI中搜索的极致性价比之路.pdf》由会员分享,可在线阅读,更多相关《杨扬_GenAI中搜索的极致性价比之路.pdf(35页珍藏版)》请在三个皮匠报告上搜索。
1、Charlie Yang AI研发经理 AWS OpenSearchPart 01.Part 01.Part 02.Part 02.Part 03.Part 03.Part 04.Part 04.单击此处修改标题单击此处修改标题单击此处修改标题单击此处修改标题OpenSearch 一体化搜索分析引擎当Agent不再是RAG,搜索引擎如何定位挽救失控的成本,来子OpenSearch的思考与实践使用Agentic Coding进行性能优化的一些思考PQ/BQ/RabitQ for KNN稀疏检索,另外一种高性价比语义检索思路OpenSearch Graph RAG,高稳定性的知识获取1 12 23
2、 34 4Q&A5 5OpenSearchOpenSearchOpenSearch 是Linux基金会旗下的100%开源搜索分析一体化引擎。OpenSearch在语义检索、可观测性、大数据分析等场景有得天独厚的优势。OpenSearch提供AI原生、高安全度、高可靠性、高性能的搜索服务,同时具备灵活构建、敏捷扩容等特性。OpenSearchOpenSearchMore than1,600,000,000Project downloads7,000Membersof User Forums4,800Membersof public Slack workspace100,000140More th
3、ansolution providers100GitHubrepositoriesNew releasessince launchMonthly page views for opensearch.org1,250,000Active contributors3,000+400+Contributingorganizationsforum viewsper month29从从RAGRAG到到“现代现代”智能体智能体输入输入Query大模型重写使用搜索引擎搜索相关文档搜索结果大模型总结回复回复Agent百度、Google等Python沙盒Latex撰写当当AgentAgent超越了语义检索超越了
4、语义检索搜索引擎并没有被边缘化搜索引擎并没有被边缘化!更具多样性的知识库形式高效的、可适配的Agent记忆细粒度Agent可观测性语义检索:ANN、Sparse、文本匹配、语义网络记忆检索:可调+自优化语义相关性、高效的过滤器(Filter)时序编排(Orchestration)Agent日志分析:高效日志分析引擎 Agent原生分析workbench Dashboard在在 2026 OpenSearch2026 OpenSearch 社区社区 瞥一眼瞥一眼多样性语义检索记忆可观测性记忆服务Agent框架起飞的起飞的tokentoken,控制不住的静态持续成本,控制不住的静态持续成本搜索引擎
5、成本基础存储索引构建搜索流量RAMSSDCPURAMCPURAM大模型Token成本Skill Host静态持续成本其他成本不要小看数据量不要小看数据量!自建开放内容知识库IM聊天记录视频会议转文字Google:100B+web pages 100M increasing each daySlack:Each weeks message log:4.7B increasing.Zoom:Organizations generate massive amounts of videos providing searchable transcripts,effectively turning you
6、r video into text.AgentAgent 原生功能支持原生功能支持Neural Search语义检索套件AgentMemoryAPIAgent执行框架DiskANNDiskANN,用硬盘来救场,用硬盘来救场当内存成本成为整个系统瓶颈的时候,单位存储可以索引的向量数成为了关键。SSDRAM压缩后的向量+码表全尺寸向量+图邻接表优化读取 格式PQBQRabitQ慢一些,但是成本更低。稠密向量稠密向量KNNKNN全系量化器支持全系量化器支持PQBQRabitQ量化建图/量化搜索/后置重排序稀疏编码与无推断稀疏编码与无推断(inference-freeinference-free)检索