当前位置:首页 > 报告详情

A1--范昊天--多模态大模型赋能可解释性画质评估任务.pdf

上传人: 分** 编号:930122 2025-10-02 39页 5.84MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了抖音集团在多媒体画质评估任务上的实践与探索。关键点如下: 1. 抖音构建了端到端的多媒体质量分析体系,提高了画质评估的效率和准确性。 2. 利用大模型重新定义画质评估任务,提出了高度可解释的质量评估方法,并开发了EvalMuse自研文生图评估体系。 3. 发布了ViDA-UGC数据集,用于评估大模型在单图画质感知能力上的表现,通过强化学习对齐主观偏好,提升了画质评估的准确性。 4. 抖音画质大模型应用实践包括智能断言和批量画质分析,提高了主观评估的置信度和效率。 5. 展望未来,提出了迈向感知修复一体化的统一大模型,实现对多种图像恢复任务的处理。 核心数据:ViDA-UGC数据集包含10k+精标图像;Qwen-2.5VL模型经过GRPO强化学习后,画质评估准确性提升了4.51%。
"抖音大模型如何提升画质?" "AI修复照片,效果如何?" "多模态大模型在画质评估中的应用"
客服
商务合作
小程序
服务号
折叠