云鹰平台是光大科技基于云原生技术自研的全链路可观察性平台,云原生项目组历时11个月的努力奋战,已于2020年12月16日先后投入集团容器云开发、测试、生产环境中,正式进入试运营阶段!
平台介绍
云鹰平台支持数据中心拓扑可视化、调用链路可视化、监控、日志对接等功能;提供全链路可视化、指标分析、故障溯源等服务。平台旨在助力开发与运维人员全面掌握业务和开源系统的工作原理、快速发现与分析业务应用的故障与性能瓶颈,从而实现开发效率与服务稳定性的全面提升。
依托云原生开源与开放的生态理念,目前云鹰支持诸如Mysql、Zabbix、Prometheus、Elasticsearch等多种数据源及其聚合可视化。此外,为了满足企业的定制化需求,平台还实现了面板权限管理、数据源权限管理等实用性功能。
通过自定义追踪指标,用户可以对实例中的各类指标进行收集,如链路延迟、JVM 堆大小、实例 GC 次数、数据库慢查询等;也可以为不同的指标设置不同的预处理方式,从而帮助开发者更快速的定位问题所在。
支持代理与字节码探针等多种链路追踪服务,可以为多平台多技术栈语言的应用与数据库、MQ、NoSQL 等服务提供无侵入的链路追踪服务,提高分布式应用、微服务体系中问题定位和架构性能优化的效率。
平台通过关联多种监控数据并深度融合告警、日志和追踪服务,基于可观察性理念,提供从告警到链路追踪层层深入的完整故障排查工作流,步步引导直达问题核心,全面提升监控体验与问题处理效率,从而间接提升系统韧性。
常见应用场景
-
发现请求时间过长,需要定位调用链在什么地方消耗了较多的时间;
-
需要了解一个复杂的业务逻辑会涉及到哪些服务与接口及各个接口的调用时序;
-
想知道一个请求发生时,各个组件的资源利用率发生了怎样的变化,又输出了哪些日志;
-
观察任一组件、节点的性能波动,和同一时刻的哪些请求相关;
-
观察一个间隙发生的错误,何时发生、如何发生以及发生时各个组件的状态如何。
以上需求场景云鹰平台均提供了最佳实践。此外,平台现已支持接入Go、Java、PHP、C++、Python等多种语言研发的分布式服务。
未来,光大科技还将在云原生可观察性解决方案的道路上继续前行,引入全链路压测和混沌工程,为集团及下属企业的业务发展保驾护航。
扫码关注EBCloud!
原创文章,作者:EBCloud,如若转载,请注明出处:https://www.sudun.com/ask/32597.html