存档

文章标签 ‘监控’

运维规则浅谈-8

2014年5月28日 2,740 views 没有评论

运维规则浅谈-8

定位瓶颈。

我们需要监控一切,这样我们才能预先发现系统的瓶颈。 对于一些资源的争用,通过监控系统就能够很直观的反应出来。而对于一些隐藏比较深的资源瓶颈,系统瓶颈,往往需要我们利用各种工具,靠经验去分析,判断。我们需要有意思的尽可能的通过监控系统去发现问题,让监控系统变得越来越智能,较少依赖于人的经验。

高级工程师和初级工程师有一个很大的区别,高级工程师知道如何去定位瓶颈所在。不仅知道如何使用工具,还知道何时、何地、为什么去使用工具,这样,他才有可能在问题爆发之前,就定位到瓶颈所在。 那么作为运维工程师,就有必要可以的去训练这种技能。自己测试/验证,wiki分享,组内分享都是可以考虑到方式。

定位瓶颈,还需要比较多的其他领域的知识,因为数据可能经过许多环节,如本地电脑、浏览器、dns服务、负载均衡设备、应用服务器等等。在熟悉自己的工具和领域外,了解其他领域大概有一些什么方法和工具是有帮助的。

运维规则浅谈-1

2014年1月20日 1,589 views 评论已被关闭

大一些的公司,可能有完善的性能模型,尽可能的进行容量/性能 预测。 而小公司,可能更多信任第三方的监控机制,并没有做到很好的性能规划。随着公司不断发展,容量模型是需要逐步建立的, 至于起到的效果几何,也需要有明晰的认识。切记,不要在容量/性能的高度压力下考虑优化,先扩容,把症状降低下来,然后考虑优化,往往是更靠谱的。

确保网络可用,网络在应用层软件和数据库软件的下一层,网络的不可靠,将直接影响到数据库/应用服务器的稳定和性能, 由于网络的复杂性,也必将导致应用软件的复杂,对此应该有清晰的认识。

不要因为解决问题,而在你的架构中引入“新的我问题“ 。对于核心架构/算法 的调整,往往导致异常,”回归测试“可以发现一些问题,但更多依赖于研发同学对于风险的认识,尽可能的解耦,否则调整的代价太大,引入的问题较多。

运维架构的一些思考(3)

2012年5月29日 2,454 views 没有评论

关于监控.

关于监控的查看, 许多时候,不只是运维人员需要查看,研发同学也需要查看,产品同学可能也想看看. 用户希望的是单点登录获取所有有用信息,他需要从一个点就可以获取到所有的信息,而不是存在多个信息孤岛,所以有必要整合各种监控产品.让用户尽可能方便获取他要关注的一些指标.
如果研发同学也能实时查看到整个服务的一个性能变化趋势, 会有助于他们改进程序.
许多故障发现问题的时候,往往已经晚了,如果监控并没有及时发现, 那么是否有更实时的方式, 是否可以对关键的访问进行实时统计,实时在线记录各种性能数据呢?这样会投入一定开发成本, 但对于用户体验的改善更有针对性.
生产环境, 数据库往往在最后一环, 如果应用服务不能及时预警,那么一个小小的升级,都可能导致突然数据库流量大增, 导致数据库宕掉.  互联网公司许多服务为了快速上线,压力测试往往并没有做. 部分原因是认为开发成本高,想赶进度,部分原因是产品和研发同学自己都不清楚具体的数据, 许多人希望进行快速上线,快速迭代, 在运营中不断调整架构和改善程序,  如果要适应这样的模式, 更加需要服务的监控预警功能,有必要细化到许[……]

Read more

cacti添加mysql监控

2010年1月14日 9,583 views 没有评论

cacti添加mysql监控[……]

Read more

分类: 互联网技术 标签: , , ,

利用cacti监控memcached

2009年6月30日 2,325 views 没有评论

利用cacti监控memcached[……]

Read more