当前位置:首页 > 报告详情

1. 重塑RTC未来大模型浪潮下的技术变革与展望(宋利).pdf

上传人: 2*** 编号:144986 2023-10-28 30页 16.39MB

1、重塑RTC未来大模型浪潮下的技术变革与展望宋利上海交通学2011-2018随着终端能力增强、规模增大,音视频点播直播业务量大量增长;Google收购WebRTC并进行了开源,大量VoIP产品进入市场;2018-2023视频通话、在线会议、在线教育等应用蓬勃发展、全面应用;重视技术优化,RTC的传输速度和弱网抵抗能力进一步提高2023-至今传统RTC优化进入瓶颈期;日新月异的大模型和AIGC业务需要更强的RTC能力做支撑;实时通信技术发展历程多模态媒体大模型TextImageSensorAudio3DMotorLarge Language Model表示对齐推理生成评价编码交互EncoderDe

2、coderTransport:User CloudTransport:Cloud UserPart OnePart TwoPart Three1实时通信RTC关键技术RTC基本架构网络层络层处理数据传输的底层细节,包括ICE、STUN等协议,帮助穿越防墙、发现对端地址、建络连接。同时也包括建、维护和关闭连接,以及交换有关媒体流的信息。音视频处理层媒体捕获:获取来克和摄像头的媒体流。媒体通信:压缩和解压缩频和视频数据。络传输:处理通过络传输的频和视频数据,包括带宽适应和丢包恢复。媒体渲染:将接收到的媒体流显示在浏览器中的频和视频元素上。面向TCP的拥塞控制基于固定规则的基于丢包:Reno,CUB

3、IC基于延时:Vegas,LEDBAT基于拥塞:BBR,Iris基于学习的基于尔可夫模型:TCP Remy基于在线学习:PCC Vivace/Verus实时通信关键技术-拥塞控制面向RTC的拥塞控制算法基于固定规则的:GCC通过增减单次发送的分组数量,使其逼近当前的络承载量BBR/GCCFEC:Forward Error Correction 通过增加冗余数据对丢失的数据包进恢复实时通信关键技术-抗丢包策略ARQ:Automatic Repeat Request 丢包是传输过程中难以避免的项问题,可能由物理因素造成,也可能由络拥塞、控制算法滞后等造成通过重传关键数据包完成纠错HARQ(FEC+

4、ARQ)SFU:Selective Forwarding Unit 所有参与会话的流都发送到服务端,服务端将同等数量的流转发给应终端。适合对超低延时要求,并发要求不是特别的场景实时通信关键技术-媒体分发机制MCU:MultiPoint Control Unit 将所有参与会话的流都发送到服务端,服务端将所有流混流合并成路流,然后再下发到应终端。适合对超低延时要求不,对并发要求特别的场景,如规模赛事直播等场景。RTC媒体分发系统中对各应终端间视频数据的转发控制机制2结合AI技术的RTC进阶强化学习赋能在不稳定的络环境下,基于延迟的状态机内部的固定规则往往法跟踪快速变化的带宽,因此引强化学习进更灵

5、活的带宽估计,进给编码器和Pacer更准确的速率指导。QTCP,AuroraR3Net,OnRL,HRCC,BoB面向TCP:面向RTC:在RTC原框架下,在内部可以对拥塞控制模块(带宽估计器)进优化,在外部可以结合新兴流媒体处理技术。信源信道联合优化新兴流媒体处理技术 神经络编码 可分级视频编码 视频超分 视频插帧 脸压缩编码 视频源编码器发送端播放器解码器接收端拥塞控制:传输端估计络路径的平均数据速率,提供给编解码器;编解码器选择编码参数(例如帧速率和质量设置),并成具有近似于估计络容量的平均特率的压缩视频流。抗丢包:常优化案是基于信道状况调整FEC冗余率;也出现了联合神经络编码器的案,在

6、丢包时也需重传和添加冗余也能正常解码播放信源信道联合优化RTC2.0-跨层联合优化CLCC:基于强化学习的跨层拥塞控制视频特率增到定程度后,视频质量会达到种“饱和”,因为过的特率可能是对带宽资源的种浪费,对视频帧来说也会更难适应络突变;且传输层信息量有限,不能全指导QoE。CLCC不仅基于络状态来进决策,且还可以考虑编码器级别的信息,包括帧的质量、帧延迟。基于此构建了能进RL计算的、真实的视频传输实验环境。平均帧延迟降低17%23%PACC:基于用户感知的拥塞控制RTC2.0-跨层联合优化感知贯穿实时互动的整个链路,分说 发送端感知(表情捕获、动作捕获)

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文概述了实时通信(RTC)技术在近年来随着终端能力提升、网络规模扩大以及Google对WebRTC的开源而迅速发展。从2011年至2023年,RTC技术在音视频点播直播、视频通话、在线会议和在线教育等领域得到了广泛应用和不断优化,提高了传输速度和抗丢包能力。2023年至今,传统RTC技术面临优化瓶颈,而日新月异的大模型和AIGC业务需求促使RTC技术进入新的变革期。 关键点如下: 1. RTC关键技术包括网络层(如ICE、STUN协议)、音视频处理层(媒体捕获与通信)、网络传输层(带宽适应和丢包恢复)和媒体渲染层。 2. 结合AI技术的RTC进阶强化学习赋能,通过更灵活的带宽估计优化编码器和Pacer,提升RTC性能。 3. RTC3.0技术展望中,提出了基于云端代理的新型实时交互,以及适配多模态内容和AIGC的控制中心新升级,展现了RTC技术在传输多模态嵌入和交互范式扩展方面的未来趋势。 文章最后提出了RTC业务新格局和技术新范式,强调了在分布式架构、智能路由、快速避障以及弱网对抗等方面的创新实践,并展望了RTC技术在实时交互、多模态内容传输等方面的潜在变革。
如何优化RTC传输以适应大模型浪潮? 大模型和AIGC业务对RTC技术提出了哪些新要求? 未来RTC技术发展将如何影响实时通信体验?
客服
商务合作
小程序
服务号
折叠