2023语音与语言处理技术交流会(深圳)嘉宾PPT合集(共5套打包)

2023语音与语言处理技术交流会(深圳)嘉宾PPT合集(共5套打包)

更新时间:2023-06-11 报告数量:5份

报告合集目录

报告预览

  • 全部
    • 2023语音与语言处理技术交流会(深圳)嘉宾PPT合集
      • 【5】优必选的多模态机器学习技术.pdf
      • 【1】腾讯AI Lab音频与语音前端处理进展——罗艺.pdf
      • 【3】Text to Audio Generation and Editing with Latent Diffusion Models.pdf
      • 【4】Speech signal improvement in real-time communication.pdf
      • 【2】Audio Content Generation Building digitalized human and humanized AI CUHK-SZ.pdf
请点击导航文件预览
资源包简介:

1、优必选的多模态机器学习技术汇 报 人:优必选 人形机器人事业部丁万汇报人简介本科毕业于武汉大学,博士毕业于华中师范大学,曾在新加坡科技局资讯通信研究院任博士后及科学家(Scientist I)职位,主要研究方向为多模态情感识别和多模态语音合成。2019年入职优必选,主要负责优必选在/离线语音合成技术核心算法研发及产品化工作。参与编写了支持语音和视觉交互的虚拟数字人技术规范。曾获 EmotioNe。

2、腾讯AI Lab音频与语音前端处理进展罗艺腾讯AI Lab高级研究员全流程优化:数据仿真、模型设计、目标任务音频与语音前端处理Tencent AI Lab数据仿真高效单通道/多通道房间混响仿真:难点:现有房间混响仿真工具均无法满足实时生成的速度要求,且生成的混响相对于真实房间混响存在差距方法:提出针对房间混响的快速随机近似方法(FRAM-RIR)1,2,3,绕过复杂的房间反射声源路径计算过程,采。

3、Text to Audio Generation and Editing with Latent Diffusion ModelsYuancheng W12Text-to-Audio GenerationWhat is text-to-audio generation:Generate sounds that are semantically in line with descriptionsS。

4、Speech Signal Improvement In Real-time CommunicaitonYannan WangTencent Ethereal Audio Lab,Tencent,Shenzhen,ChinaOutline1.Introduction2.Speech Signal Improvement3.Future work2 BackgroundReal-time comm。

5、1AUDIO CONTENT GENERATION:BUILDINGDIGITALIZED HUMAN AND HUMANIZED AIWei XueDivision of Emerging Interdisciplinary AreasThe Hong Kong University of Science and Technology2STEPPING INTO THE VIRTUAL WOR。

展开阅读全文
客服
商务合作
小程序
服务号
折叠