常见监控系统Metric实现讨论总结
本周我们完成了关于监控系统metric实现的讨论,相关资料总结如下:
- 晓东使用的架构图:《我经历过的监控系统演进史》
- 一篇很好的讨论监控系统实现的文章:《A Tricky System Design Interview Question: Explain Server Monitoring》
- David提到的Gorilla实现的论文:《Gorilla: A Fast, Scalable, In-Memory Time Series Database》
- 使用Pull还是push相关文章:《Pull doesn’t scale – or does it?》
- Andy 提到的Uber M3相关文章:《M3: Uber’s Open Source, Large-scale Metrics Platform for Prometheus》
- Metric Storage相关资料之 ElasticSearch 《Building a High-Throughput Metrics System Using Open Source Software》
- Time Series DB相关文章: 《Writing a Time Series Database from Scratch》
- DataDog相关视频:《Building a Real Time Metrics Database at Datadog》
- Widows性能监控实现的文章:《一文带你了解Windows 性能监控系统的使用》
- 监控系统架构相关的文章:《Monitoring Architecture》
- 讨论中提到的client和server端时间不同的相关知识:《分布式系统之不可靠时钟揭秘》
- 讨论中提到的log-append技术:《深入分析数据库中数据的存储和读取》
下周话题安排和往期话题回顾敬请参见《系统设计开荒小分队话题讨论简介》
2 Responses
[…] 常见监控系统Metric实现讨论总结 […]
[…] 我们上次关于Metrtic实现的讨论总结。 […]