当前位置:首页 > 报告详情

在资源受限的边缘计算平台上高效部署大型语言模型.pdf

上传人: 芦苇 编号:651849 2025-05-01 44页 12.78MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要研究了在资源受限的边缘计算平台上高效部署大型语言模型(LLM)的方法。主要内容包括: 1. 模型设计:通过全面评估学习、模型权重和用户数据之间的权衡,为边缘LLM部署提供指导。 2. 数据选择:提出了一种基于质量指标的数据选择框架,以在边缘设备上维护高质量和紧凑的用户生成数据块。 3. RAG-CiM:通过非易失性计算内存在内存(NVCiM)加速检索增强生成(RAG),以优化LLM个性化。 4. NVCiM-PT:优化提示调整,一种基于NVCiM架构的LLM训练方法。 5. Tiny-Align:一种资源高效的跨模态(音频,文本)对齐方法,以实现LLM与用户的音频交互。 研究结果表明,适当的模型选择、数据选择和优化方法可以提高边缘LLM的性能,并使其更适合资源受限的边缘环境。
如何在边缘设备上高效部署大型语言模型? 边缘设备上的数据选择如何优化大型语言模型? 边缘计算如何实现大型语言模型的个性化?
客服
商务合作
小程序
服务号
折叠