1、 行业行业报告报告|行业专题研究行业专题研究 请务必阅读正文之后的信息披露和免责申明 1 半导体半导体 证券证券研究报告研究报告 2025 年年 09 月月 26 日日 投资投资评级评级 行业评级行业评级 强于大市(维持评级)上次评级上次评级 强于大市 作者作者 唐海清唐海清 分析师 SAC 执业证书编号:S1110517030002 李泓依李泓依 分析师 SAC 执业证书编号:S1110524040006 资料来源:聚源数据 相关报告相关报告 1 半导体-行业研究周报:25Q2 半导体业绩总结及展望:AI 驱动与国产替代共筑成长主线 2025-09-02 2 半导体-行业研究周报:3 季度半
2、导体景气度展望乐观,持续重点关注国产算力及自主可控方向 2025-08-25 3 半导体-行业研究周报:“以存代算”开启存储新纪元,7 月半导体行情延续景气 2025-08-19 行业走势图行业走势图 AI 存储革命存储革命已至已至,“,“以存代算以存代算”开启”开启存储新纪元存储新纪元 “以存代算”发展背景:“以存代算”发展背景:AI 推理成价值核心,推理成价值核心,HBM 瓶颈凸显产业痛点,“以瓶颈凸显产业痛点,“以存代算”应运而生。存代算”应运而生。当前,AI 推理已成为衡量大模型商业化价值的关键标尺,但在实际应用中仍面临“推不动、推得慢、推得贵”的严峻挑战。为突破算力瓶颈与“存储墙”制
3、约,“以存代算”作为一种颠覆性技术范式应运而生。该技术通过将 AI 推理过程中的矢量数据(如 KV Cache)从昂贵的DRAM 和 HBM 显存迁移至大容量、高性价比的 SSD 介质,实现存储层从内存向 SSD 的战略扩展,而非简单替代。其核心价值在于显著降低首 Token时延、提升推理吞吐量,并大幅优化端到端的推理成本,为 AI 大规模落地提供可行路径。“以存代算”核心技术:“以存代算”“以存代算”核心技术:“以存代算”CachedAttention 技术是一种通过将技术是一种通过将 AI 推理中历史对话的推理中历史对话的 KV Cache 缓存到缓存到 HBM+DRAM+SSD 等外部存
4、储等外部存储介质。介质。在该系统中,HBM 作为 GPU 本地高速存储,负责存储当前活跃会话的 KV Cache,支撑 LLM 推理计算;DRAM 作为中间缓存层,承接 HBM 的异步写入与 SSD 的预加载,平衡速度与容量;SSD 则作为长期存储层,提供大容量持久化存储,承载非活跃历史数据。“以存代算”CachedAttention 将首 Token 时延(TTFT)显著缩短了 87%,并提升了 Prefill 阶段 7.8 倍的吞吐量,从而将端到端推理成本降低了 70%。“以存代算”硬件突破:在以存代算”硬件突破:在“以存代算”技术范式下,“以存代算”技术范式下,SSD 不再是单纯的不再是
5、单纯的数据存储载体,而是深度参与数据存储载体,而是深度参与 AI 推理的核心组件,推理的核心组件,其需承接从 HBM、DRAM 卸载的 KV Cache,因此被赋予大容量、高吞吐、低延迟的新要求,以缓解对高成本 HBM 的依赖。同时,SSD 主控芯片作为“控制大脑”,需通过先进算法优化数据寻址调度,支撑 AI 推理中数据高效流转。在此背景下,AI SSD 技术将沿三大方向发展:颗粒上,向 QLC 颗粒演进,凭借技术升级实现高性能与大容量兼顾,满足 AI 大模型数据存储调用需求;接口协议上,以 PCIe 5.0/6.0 接口搭配 NVMe 协议为基础,未来融入 CXL 技术,进一步提升带宽与降低
6、延迟;功能上,向智能化升级,如铠侠计划推出软件让 SSD 自主处理 AI 检索任务,Solidigm 探索液冷方案优化散热,实现存储与 AI 推理的深度协同。“以存代算”企业布局:“以存代算”的核心实践已获产业龙头积极布局。“以存代算”企业布局:“以存代算”的核心实践已获产业龙头积极布局。华为华为 UCM 作为“以存代算”产品化关键载体,构建智能分级缓存,数据可根据记忆热度在 HBM、DRAM、SSD(固态硬盘)等存储介质中实现按需流动;同时融合多种稀疏注意力算法,实现存算深度协同。除了以HBM+DRAM+SSD 构建的多级缓存体系外,还存以 KVCache 缓存技术为核心的多元实践。浪潮存储