当前位置:首页 > 报告详情

超越固态硬盘:SK海力士AIN系列重新定义存储使其成为大规模人工智能的核心赋能者(SK海力士发布).pdf

上传人: 明**** 编号:1011978 2025-12-21 16页 2.32MB

1、Title(Arial Black 28pt)Redefining Memory Storage as the Core Enabler of AI at ScaleCS(CHUNSUNG)KIM,SVP of eSSD PD,SK hynixTitle(Arial Black 28pt)Nova PremierGPT-4oLlama4 MaverickDeepSeek V3 Claud 4 OpusLlamaNemotronO4-miniQwen3 235BGemini2.5 FlashGemini 2.5 ProDeepSeek R1 Grok 4Output Tokens1)(M tok

2、ens)Traditional LLM ModelReasoning ModelNot just compute speed token throughput matters too1)Answering+Reasoning Tokens*(Source)Artificial AnalysisTitle(Arial Black 28pt)TPS for 1 UserTotal TPS/MW1122Improving Token throughput Per QoS with DRAM&SSDMaximize Token throughput Per QoS with next AI Solut

3、ionsTitle(Arial Black 28pt)Title(Arial Black 28pt)RAG over GNNVectorEmbeddingVector DBSearchModel InferencePromptAugmentationMulti-UserQueriesOutputDeliveryGPUHBMPreprocessingQuery EmbeddingUser Query+Retrieved ContextModel Param.OthersKV$PrefillDecodeKV$?Title(Arial Black 28pt)PrefillDecodePromptTo

4、kenizationLLM(Weight Matrix)KV CacheLLM(Weight Matrix)DetokenizationOutputTTFT1)TPOT2)1)TTFT:Time to First Token,2)TPOT:Time per Output Token300 x more token than todayPromptUser requestLLM Response TimeResponse completedResponseResponseCompute intensiveMemory intensiveTitle(Arial Black 28pt)Planner

5、 Agent Planner Agent Reasoning LLMReasoning LLMMultimodalMultimodalVision+TextVision+TextCodingCodingLLMLLMData AnalysisData AnalysisSQL gen LLMSQL gen LLMMemory AgentMemory AgentTitle(Arial Black 28pt)Title(Arial Black 28pt)Usage modelAccessPatternThroughputGranularityKV cachingSRMed4GBSearchSpeedS

6、earchSpeedIndexSizeIndexSizeSearchQualitySearchQualityHigh throughputLow latencyFast Random access to meta-dataLatency-sensitiveHigh capacityFast Seq.ReadApplication access patterns in inferenceTitle(Arial Black 28pt)Up to 7x higher IOPS with next-gen fast NANDInnovative controll

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
全文主要探讨了SK hynix在AI规模应用中存储技术的革新。以下是关键点: 1. **AI存储需求**:强调存储作为AI规模应用的核心推动力,特别是Token吞吐量对计算速度的重要性。 2. **技术解决方案**:介绍多种AI模型,如RAG over GNN、VectorEmbedding等,以及如何通过DRAM和SSD提升Token吞吐量。 3. **性能提升**:提出通过使用新一代快速NAND和优化控制器设计,实现高达7倍IOPS的提升。 4. **内存优化**:引入AIN B技术,允许模型参数和批处理大小随Token增加而增加,提高效率。 5. **未来展望**:展示SK hynix的AIN家族未来发展方向,包括HBM、SSD和NAND技术的结合。
"AI加速,存储新纪元?" "LLM推理,速度与质量并重?" "SK Hynix AIN,未来已来?"
客服
商务合作
小程序
服务号
折叠