8-1 Apache Flink 流批一体的规划和在快手的进展.pdf

编号:102497 PDF 34页 1.49MB 下载积分:VIP专享
下载报告请您先登录!

8-1 Apache Flink 流批一体的规划和在快手的进展.pdf

1、FLINK 流批一体的规划和在快手的进展张静快手基础技术部Apache Flink Commiter|01社区在流批一体社区在流批一体方向的演进方向的演进02快手在流批一体快手在流批一体方向的进展方向的进展03社区在流批一体社区在流批一体方向的规划方向的规划04快手在流批一体快手在流批一体方向的未来工作方向的未来工作目录目录CONTENT|社区在流批一体社区在流批一体方向的演进方向的演进01|为什么要做流批一体计算引擎|业务侧引擎侧p 降低开发成本一套业务代码p 提高数据质量口径一致p 降低资源开销避免重复计算p 降低运维成本维护一套引擎p 降低学习成本技术聚焦Apache Flink 流批一

2、体架构|SQL&Table APIRelationalDataStreamPhysicalDAG SchedulerDAG APIUnified Source API&Sink API&Operator APIPluggable Shuffle APIUnified API(Done in 1.101.14 version)|SQL&TableRelationalDataSetbatch DataStreamstreaming Batch Plan Stream Transformation Batch Runtime Streaming RuntimeSQL&TableRelationalS

3、tream Graph RuntimeDataStream PhysicalQuery ProcessorPipeline Region Scheduling(Done in 1.12 version)|Pipelined Regionp 以 Pipelined 边连接的 Task 集合p 基本的调度单元Pipeline Region Schedulerp 流作业GlobalAggregateRegion1Region2Source -Filter-LocalAggregateGlobalAggregatep 批作业Source -Filter-LocalAggregateAdaptive B

4、atch Scheduling(Introduced in 1.15 version)|根据已经结束的 producer 的数据量动态确定下游并发度GlobalAggregateRegion1Region2Source -Filter-LocalAggregate优点p 不需要用户手动设置批作业的并发度p 自动适应每天变化的数据量Adaptive Batch Scheduling(Future plan)|N:number of consumer execution verticesP:number of sub partitions.For the kth consumer executio

5、n vertex,the consumed sub partition range should be:range=floor(P*(k-1)/N),floor(P*k/N)-1A0RS0RS1A1RS0RS1RS2RS2Range0,0Range1,2B0B1TODOp 下游并发之间的负载均衡p 动态调整下游算子Pluggable Shuffle API|p Blocking ShuffleShuffle 数据落盘TaskManager Shufflep write to local diskp read from upstream TaskManagerExternal Shuffle S

6、ervicep write to local diskp read from upstream shuffle serviceFLINK-13247Remote Shuffle Servicep write to remote ShuffleWorkerp read from remote shuffleWorkergithubPluggable Shuffle API|p Pipeline ShuffleShuffle 数据不落盘p Hybrid Shuffle(规划中)根据资源情况,动态决定落盘还是不落盘快手在流批一体快手在流批一体方向的进展方向的进展02|还有哪些痛点|痛点 资源浪费Ta

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(8-1 Apache Flink 流批一体的规划和在快手的进展.pdf)为本站 (云闲) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠