语音合成在字节跳动平台的应用探索-王玉平.pdf

编号:127309 PDF 28页 7.36MB 下载积分:VIP专享
下载报告请您先登录!

语音合成在字节跳动平台的应用探索-王玉平.pdf

1、语合成在字节跳动的应探索王平字节跳动语合成科学家个介绍高级技术专家阿里巴巴负责达摩院语音合成相关技术及业务建设阿里巴巴的语音合成系统从传统语音合成技术逐渐向深度学习演进负责车机、客服、天猫精灵等语音合成相关业务团队建立和招聘语音合成相关技术的建设及探索业务熟悉及支持语音合成方向总体规划引擎及服务开发基础技术积累声学模型声码器声音转换结合业务落地的思考多模态业务落地抖音、西瓜视频等2019年4月加入字节跳动AILab语合成综述字节跳动语合成系统介绍语合成与平台结合案例未来展望语合成综述语合成的历史起源阶段电合成器阶段单元挑选拼接合成阶段基于HMM的参数合成阶段基于深度学习的语合成语合成的相关模块

2、本前端声学模型声码器文本前端声学模型声码器文本语音本前端本前端本正则化现在是2021-11-11 现在是零年韵律预测本正则化后的模块#就是韵律预测了多字消歧我们【】来到了典【当】【】声学模型&声码器声学模型TacotronFastSpeech声码器Gan vocoderLpcNetWaveRnn语合成提升合成语的质量提升然度提升质提升合成语的表现结合上下降低合成语的数据量预训练模型+克隆字节跳动语合成系统介绍语合成本前端BERT+BLSTM+CRF声学模型Tacotron&FastSpeech声码器AR&Gan语合成具备业界领先的语音合成系统,可以生成自然、有表现力、个性化的语音克隆快速、全动

3、、低成本的定制案全动的数据预处理以及模型训练,需预基于质量的预训练声学模型质量的通声码器唱歌&说唱合成说唱(Rap Synthesis)唱歌(Singing Synthesis)声转换另外个的将同样的内容说/唱出来2分钟训练数据即可达到稳定效果,30分钟以上更佳声转换-唱歌另外个的将同样的内容说/唱出来2分钟训练数据即可达到稳定效果,30分钟以上更佳从说话数据中学会特征,从让说话唱歌语合成与平台结合的案例应:创作具落地场景:抖、视频等促进投稿:全新的表达和叙事具启发创意:多种配玩法丰富视频表达,优化户在添加本时的体验多个趣味可供选择应:娱乐化表达落地场景:抖、视频等户参与到乐相关的创作,让创作更有趣应:视频配落地场景:抖、视频等实现内容互通与内容创作平台深度结合,赋能内容创作和互动未来展望未来展望夯实基础技术声学模型&声码器前沿技术探索Speech PSSpontaneous TTS未来展望丰富、提升多语合成能,深业务定制解决案。攻克UGC视频配场景下的新技术挑战(情感化配、跨语合成等)。建设“声超市”:站式选择和产平台建设“声开放平台”:借助社区量,打造UGC声产和授权市场One more thing智能频-One more thing智能乐

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(语音合成在字节跳动平台的应用探索-王玉平.pdf)为本站 (2200) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠