1、腾讯在云原生可观测领域的探索与实践黄杰/技术专家个人简介个人简介目前负责腾讯云云原生可观测产品专注于监控、可观测性开源爱好者目录目录什么是云原生可观测性如何实施可观测性如何产品化总结展望什么是云原生可观测性什么是云原生可观测性与监控的区别可观测性几大支柱如何建立关系监控监控 vs 可观测可观测监控监控-系统是否正常工作-解决个体问题-Log/Metric/Trace,但相对独立可观测可观测-系统是否正常工作,为什么无法工作-解决系统问题-Log/Metric/Trace/Event/Profiler等-数据之间的上下文,关系及相关性服务架构在变化服务架构在变化-系统更加复杂-上下游依赖更多-环
2、境越来越复杂-效率要求越来越高-人员角色越来越多单VMN VM一个常见的服务部署架构,大体包括如下几点:一个常见的服务部署架构,大体包括如下几点:-服务应用之间存在调用-服务运行在基础设施-服务依赖于一些中间件或者基础设施应用应用AVM/K8S应用应用CDB/Cache/Queue运行依赖应用应用B调用调用服务架构在变化服务架构在变化可观测性几大支柱可观测性几大支柱LoggingTracingMetricsMetrics-业务指标:订单数-应用服务指标:延时、失败率-中件间指标:缓存命中率、消息积压-系统基础设施指标:CPU使用率、网络带宽如何快速找到对应的Trace/LogTracingga
3、tewaycreate_orderuser.serviceget_usermysql/selectorder.servicemysql/insertmake_orderredis/put0ms50ms100ms200ms182ms50ms125msTraceId:xxx-123454服务Spans/LogsStatus/Attr.Region:sh Host:192.168.10.100Region:sh Host:192.168.10.130Region:sh Host:192.168.10.120user_db(192.168.10.88)order_cache(192.168.10.11
4、)如何快速找到对应的LogLoggingWhenTimestamp:2020-11-06T15:02:10.249ZMessageLevel:infoMsg:HTTP client successOtherTraceId:fb0fbe72.Trace.WhereRegion:shHost:sh-order-vm-1/192.168.1.10WhoService:order.serviceTeam:order通用属性-可读性-可检索性-中央集中式如何快速找到对应的请求上下文Logging 关联性关联性没有上下文,没有 TraceID通过 TraceID 构建请求上下文Metrics 关联性关联性
5、-业务指标:订单数-应用服务指标:延时、失败率-中件间指标:缓存命中率、消息积压-系统基础设施指标:CPU使用率、网络带宽通过 Trace 提取计算 MetricsHealth CheckGET http:/192.168.1.20:8080/health serviceName:”order.service”,status:”up”,dependencies:name:”user.service”,status:”up”,name:”192.168.1.99:3306”,status:”up”,Events变更变更应用发布/配置变理.事件事件OOM/告警/扩缩容.serviceName:”o
6、rder.service”,type:”change”,tags:key:”version”,value:”v1.0.1”,key:”commit”,status:”34w2323”,key:”runtime”,status:”jdk1.8”,Region:sh Host:192.168.10.120相互关联相互关联MetricsAggregatableTracingRequest scopedLoggingEvents可观测性几大支柱可观测性几大支柱OpenTelemetry目录目录什么是云原生可观测性如何实施可观测性如何产品化总结展望如何建设可观测性