.

阿里巴巴在数据化运维上的最佳实践

事前有预案

高仿真压测、依赖分析、故障演练

事中有措施

全链路监控、流控降级

事后有分析

代码级别的故障诊断

核心场景

中小企业快速构建云上微服务应用

通过 SAE 帮用户屏蔽底层 IaaS 购买和运维细节,屏蔽底层镜像仓库和 Kubernetes 细节,低门槛通过 WAR/JAR 方式部署微服务应用,大幅提升运维效率,让企业聚焦核心业务本身。

应用环境随需灵活启停,节省成本

企业应用通常都有多套环境,除线上环境外,其它环境闲置率高,但重新搭建一套环境的成本也高。SAE 提供了一键启停开发测试环境的能力,即开即用,节省成本,方便运维。

利用弹性伸缩来应对不确定的突发流量

互联网、游戏类应用大促活动峰值流量不确定,SLA 和机器成本的平衡点不好找。SAE 提供自动弹性伸缩的能力,帮助应用自动轻松应对流量高峰,保证 SLA 的同时也节省机器成本。

支持的开源生态

Prometheus

分布式性能监控工具

JMeter

Java 压力测试工具

Sentinel

轻量级的流控组件

ChaosBlade

混沌工程工具

OpenTracing

开放式分布式追踪规范

部分客户案例