2023语音与语言处理技术交流会（深圳）嘉宾PPT合集（共5套打包）

更新时间：2023-06-11 报告数量：5份

2023语音与语言处理技术交流会（深圳）

2023语音与语言处理技术交流会（深圳）嘉宾PPT合集

资源包简介：

1、优必选的多模态机器学习技术汇报人：优必选人形机器人事业部丁万汇报人简介本科毕业于武汉大学，博士毕业于华中师范大学，曾在新加坡科技局资讯通信研究院任博士后及科学家（Scientist I）职位，主要研究方向为多模态情感识别和多模态语音合成。2019年入职优必选，主要负责优必选在/离线语音合成技术核心算法研发及产品化工作。参与编写了支持语音和视觉交互的虚拟数字人技术规范。曾获 EmotioNe。

2、腾讯AI Lab音频与语音前端处理进展罗艺腾讯AI Lab高级研究员全流程优化：数据仿真、模型设计、目标任务音频与语音前端处理Tencent AI Lab数据仿真高效单通道/多通道房间混响仿真：难点：现有房间混响仿真工具均无法满足实时生成的速度要求，且生成的混响相对于真实房间混响存在差距方法：提出针对房间混响的快速随机近似方法（FRAM-RIR）1,2,3，绕过复杂的房间反射声源路径计算过程，采。

3、Text to Audio Generation and Editing with Latent Diffusion ModelsYuancheng W12Text-to-Audio GenerationWhat is text-to-audio generation:Generate sounds that are semantically in line with descriptionsS。

4、Speech Signal Improvement In Real-time CommunicaitonYannan WangTencent Ethereal Audio Lab,Tencent,Shenzhen,ChinaOutline1.Introduction2.Speech Signal Improvement3.Future work2 BackgroundReal-time comm。

5、1AUDIO CONTENT GENERATION:BUILDINGDIGITALIZED HUMAN AND HUMANIZED AIWei XueDivision of Emerging Interdisciplinary AreasThe Hong Kong University of Science and Technology2STEPPING INTO THE VIRTUAL WOR。

展开阅读全文

2200 专家认证

该用户很懒，什么也没介绍

2023语音与语言处理技术交流会（深圳）嘉宾PPT合集（共5套打包）

报告合集目录

报告预览

相关合集

其他合集