CAT
简介 CAT是一个实时和接近全量的监控系统(调用链监控,不适用于全链路监控),它侧重于对Java应用的监控。提供系统的性能指标、健康状况、监控告警等功能 github、深入详解美团点评CAT跨语言服务监控 CAT服务端不可用时,不会影响客户端执行;待服务端重启成功后客户端会将不可用期间的日志重新发给服务端 客户端将监控日志上传到服务端,服务端先存储在内存中,定期会将上一个小时的数据落到数据库中(hourlyreport、hourly_report_content),天/周/月数据则在凌晨进行计算落库 报表类型 Transaction报表:一段代码运行时间、次数、失败率、QPS,比如URL、Cache、SQL执行次数和响应时间 Event报表:一行代码运行次数、失败次数,如Exception出现次数。Event报表的整体结构与Transaction报表几乎一样,只缺少响应时间的统计 Problem报表:根据Transaction/Event数据分析出来系统可能出现的异常,包括访问较慢的程序等 Heartbeat报表:JVM内部一些状态信息,比如Memory,Thread等 Business报表:使用Metric实现业务监控报表,比如订单指标,支付等业务指标。与Transaction、Event、Problem不同,Business更偏向于宏观上的指标,另外三者偏向于微观代码的执行情况 ...