一文告诉你如何全方位监控Linux系统状况
作为Linux系统运维人员,需要实时掌握Linux系统的运行负载,网络状态,磁盘,内存使用情况。所以作为开源监控警报系统prometheus, 官方自然给大家提供了这样一套工具,可以监控多个服务器的实时运行状况,以及实时警告。 Prometheus提供了node_exporter给广大运维人员使用,这是一个相当强大,且统计全面的工具。https://github.com/prometheus/node_exporter, 这个是node_exporter的github地址。 启动node_exporter非常简单,官方提供了docker镜像给我们使用,我们只需要简单的命令就可以把node_exporter启动起来。
net指定host,表示我们启动的container共享主机的网络信息,可以直接访问主机上的网络信息。 pid指定host,container里面可以获取主机上的所有进程运行信息。 同时,为了了解文件系统的信息,需要把物理机的根目录/挂载到docker的/host目录,并告诉node_exporter容器,在container里面哪个是物理机的根目录,在这里就是/host。 启动之后,node_exporter默认监听的端口是9100,这个时候我们就可以直接测试metrics是否可以拿到。
这时候我们就会拿到node_exporter所有的metrics。 接下来,需要配置prometheus去哪里采集node_exporter的metrics信息,添加target到prometheus里面。 添加node exporter目标 这里我们添加了一个新的targets用于采集node_exporter的metrics。 然后,,我们需要添加官方提供node_exporter的grafana dashboard。 https://grafana.com/dashboards/1860 node_exporter dashboard 点击右边的Copy ID to clipboard.或者是download json文件。 导入新的dashboard 拷贝ID到表单里 grafana自动从官网的仓库中,下载json文件,选择数据源。 服务运行状况图表 监控的层面 然后我们可以看到在grafana新建的dashboard中,会出现从各个层面拿到的实时的运行状态的数据。后面我们就可以通过grafana的alert或是prometheus的alertmanager组件来根据设定好的阈值来发警告给运维人员。 【编辑推荐】
点赞 0 (编辑:焦作站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- Windows 10中的“错误的系统配置信息”:如何解决错误
- 最后的XP:嵌入式Windows Embedded POSReady 2009停止服务
- Windows 10新补丁KB4515384成噩梦:Bug接连不断
- windows-server-2012-r2 – Windows Server 2012 R2重新推出
- windows-7 – 从Windows 7通过Webdav连接?
- 完全修复:Windows 10的WiFi连接每隔几秒就会丢失一次
- Windows 10中的家长控制:如何控制他们的操作并在PC上看到您
- 谷歌内战:高管要利润,员工要价值观,谁是灵魂
- 一张图看懂Linux内核运行交互关系,值得收藏!
- 查看 Linux 系统服务的 5 大方法