1、趣丸科技多云架构下稳定性保障朱少华朱少华目前主要负责趣丸业务稳定性相关工作(业务高可用和容灾建设、混沌工程实践、AIOps探索等),保障趣丸相关业务产品的稳定运行和利用混沌工程推动业务韧性建设。曾就职于西山居、人人网等公司,从事虚拟化、容器化和 Devops等平台开发工作。现任趣丸-技术保障部运维架构师嘉宾照片目录CONTENTS趣丸多云架构的引入01 多云架构的挑战与优势02 趣丸多云架构稳定性解决方案03 总结和展望04 01趣丸多云架构的引入趣丸多云架构发展趣丸多云架构的引入阶段1阶段22021年2023年阶段1.52024年-阶段3伪多活多云多活单元化多云架构阶段1接入层固定百分比流量
2、业务层实现多云部署数据层单边读、写业务层数据层A云B云50%读写读写50%伪多活阶段接入层问题业务层不具备流量调度和故障转移能力数据层单云部署,整体来看是个单点多云架构阶段2业务层实现多云多活,具备10S内故障转移能力数据层实现多云容灾,业务根据延迟需要就近读、单边写,故障场景自动切换数据源,具备秒级或分钟级RPO/RTO能力。业务层数据层A云B云X%(100-X)%双向同步读写写读failover读多云多活阶段接入层02多云架构的挑战与优势多云网络互联互通业务层流量调度基础设施异构数据层跨云容灾建设多云架构的挑战与优势避免供应商锁定:防止过度依赖于单一的云服务供应商提高稳定性:多云多活,保障
3、业务连续性取长补短:不同的云供应商可能在特定的领域或功能有特长03趣丸多云架构稳定性解决方案趣丸多云架构现状业务多云多活,数据层部分多活部分业务实现单边写,就近读IngressGatewayServiceAServiceBControl PlaneIngressGatewayServiceBServiceAControl Planefailoversync高防高防Cloud ACloud B趣丸云原生架构下多云稳定性保障多云互联01 业务多活02 线上质量保障03 多云互联双专线+VPN实现多云网络互联+多级链路冗余VPCVPCVPCVPCVPCVPCA云B云专线1专线2冷备VPCVPCVPC
4、VPCVPCVPCA云B云专线1专线2双专线冷备切换时间长(5分钟)专线资源利用率低双专线隧道(BGP-ECMP+BFD)实现10S内感知链路问题并收敛路由提高专线资源利用率多云互联双专线+VPN实现多云网络互联+多级链路冗余双专线+VPN热备(BGP-ECMP+BFD)在双专线中断时,VPN接管流量保障业务不中断多条VPN共担流量,保障带宽充裕VPCVPCVPCVPCVPCVPCA云VPN隧道B云双专线趣丸云原生架构下多云稳定性保障多云互联01 业务多活02 线上质量保障03 业务多活/南北向流量云A云B智能 DNS:全局流量控制,实现接入层多活HTTP DNS:绕过运营商 Local DN
5、S,防止域名劫持和区域封堵兜底:APP 自主检测切换入口多活业务多活/南北向流量云原生高防WAF云A云原生高防WAF云B云原生高防:接入简单、延迟低、防护性能灵活选择WAF:基于 Istio IngressGateway,接入简单、灵活定制攻击防御业务多活/东西向流量Istio 的多云流量管理单一网格的多主架构模式ServiceAServiceBControl PlaneServiceBControl PlaneServiceACluster:cloudACluster:cloudB每个集群一个控制面更强的可用性配置隔离多个集群一个网格 工作负载直接相互访问Network:network1Is
6、tio Mesh业务多活/东西向流量Istio 的多云流量管理流量管理策略:本地优先Cluster:cloudA Region1Cluster:cloudB Region2优先访问本Region,本Zone本Zone失效,优先访问本Region其他Zone本Region失效,访问其他Region的ZoneIstio MeshServiceBZone:zone1ServiceAZone:zone2ServiceBServiceBZone:zone312 loadBalancer:localityLbSetting:enabled:true failoverPriority:-topology.i