1、快手可图大模型技术揭秘与应用探索专题:多模态大语言模型的前沿应用与创新2024.08.18 中国 上海主讲人:快手可图大模型负责人 李岩12 可图大模型介绍 可图大模型技术讨论一:怎样选择合适的文本表征 可图大模型技术讨论二:什么是RLHF的关键因素 可图大模型技术讨论三:怎样让大模型写好中国字 可图大模型技术讨论四:怎样做好虚拟试穿 视觉生成方向的未来展望主要内容3 可图大模型介绍 可图大模型技术讨论一:怎样选择合适的文本表征 可图大模型技术讨论二:什么是RLHF的关键因素 可图大模型技术讨论三:怎样让大模型写好中国字 可图大模型技术讨论四:怎样做好虚拟试穿 视觉生成方向的未来展望主要内容4
2、可图大模型介绍(1/11)快手自研大模型体系全景图5可图大模型介绍(2/11)可图可灵傻傻分不清楚6可灵AI平台国内版:https:/;可灵AI平台海外版:https:/=+可图大模型介绍(3/11)最懂中文的文生图大模型78可图大模型介绍(4/11)内外部人工评测结果 内部评测结果:https:/ 外部评测结果:https:/ Hugging Face模型地址:https:/huggingface.co/Kwai-Kolors/Kolors 技术报告地址:https:/ 7月6日,快手高级副总裁、主站业务与社区科学负责人盖坤(于越)在世界人工智能大会(WAIC)上宣布,快手旗下的文生图大模型
3、可图(Kolors)将全面开源。可图(Kolors)支持中英文双语,生成效果比肩Midjourney-v6水平,支持长达256字符的文本输入,具备英文和中文写字能力。目前,可图(Kolors)已在Hugging Face平台和GitHub上线,包括模型权重和完整代码,供个人开发者免费使用。WAIC2024官网 10可图大模型介绍(6/11)国内外开源社区反响GitHub平台Fork和Starred情况Hugging Face平台Kolors基座模型下载情况11可图大模型介绍(7/11)国内外开源社区反响Hugging Face平台Model和Space趋势热榜Bilibili平台有关可图Kol
4、ors的教程12可图大模型介绍(8/11)国内外开源社区反响微信用户群创作者反馈Bilibili平台部分可图内容封面13可图大模型介绍(9/11)可图插件生态逐步完善可图Kolors大模型插件生态逐步完善,目前IP-Adapter-Plus,IP-Adapter-FaceID-Plus,ControlNet-Canny,ControlNet-Depth,ControlNet-Pose,Inpainting模型,Dreambooth-LoRA训推代码均已发布14李彦宏:开源模型是智商税“有些个外行甚至混淆了模型开源和代码开源这两个概念。模型开源你拿到的是一大堆的参数,你还是要去做SFT,还是要去
5、做安全对齐,你不知道这些参数是怎么来的,你是无法做到“众人拾柴火焰高”的,即使你拿到对应的源代码,你也不知道他用了多少数据,用了什么比例的数据去训练这些个参数,所以拿到这些东西并不能够让你站在巨人的肩膀上去迭代和开发。”扎克伯格:Open Source AI Is the Path Forward 如果Meta是唯一一家使用Llama的公司,那么这个生态系统就不会发展;开源任何给定模型并不会失去当时相对于下一个最佳模型的巨大优势;Meta与封闭模型供应商之间的一个关键区别是,出售AI模型访问权限不是我们的商业模式;Meta拥有悠久的开源项目和成功历史。让供应链在我们的设计上实现标准化,节省了数
6、十亿美元。stability.ai 一季度收入不足500万美元 亏损超过3,000万美元 欠云计算提供商和其他公司近1亿美元 全球知名图片提供商Getty Images起诉stability.ai 创始人兼CEO Emad Mostaque宣布离职 Robin Rombach、Andreas Blattmann、Dominik Lorenz等主要技术核心离职可图大模型介绍(10/11)可图开源背后的思考逻辑152023.07 stability.ai开源SDXL2024.04 北大&字节开源VAR2024.05 腾讯开源混元DiT2024.07 快手开源可图Kolors2024.08 Blac