- Docker 简介
- 什么是 Docker
- 为什么要用 Docker
- 基本概念
- 镜像
- 容器
- 仓库
- 安装 Docker
- Ubuntu
- Debian
- Fedora
- CentOS
- Raspberry Pi
- macOS 安装 Docker Desktop CE
- Windows 10
- 镜像加速器
- 使用镜像
- 获取镜像
- 列出镜像
- 删除本地镜像
- 利用 commit 理解镜像构成
- 使用 Dockerfile 定制镜像
- Dockerfile 指令详解
- COPY 复制文件
- ADD 更高级的复制文件
- CMD 容器启动命令
- ENTRYPOINT 入口点
- ENV 设置环境变量
- ARG 构建参数
- VOLUME 定义匿名卷
- EXPOSE 暴露端口
- WORKDIR 指定工作目录
- USER 指定当前用户
- HEALTHCHECK 健康检查
- ONBUILD 为他人作嫁衣裳
- 参考文档
- Dockerfile 多阶段构建
- 实战多阶段构建 Laravel 镜像
- 构建多种系统架构支持的 Docker 镜像
- 使用 buildx 构建多种系统架构支持的 Docker 镜像
- Docker v18.09 版本使用 BuildKit 构建镜像
- Docker v19.03 版本使用 BuildKit 构建镜像
- 其它制作镜像的方式
- 实现原理
- 操作容器
- 启动
- 守护态运行
- 终止
- 进入容器
- 导出和导入
- 删除
- 访问仓库
- Docker Hub
- 私有仓库
- 私有仓库高级配置
- Nexus 3
- 数据管理
- 数据卷
- 挂载主机目录
- 使用网络
- 外部访问容器
- 容器互联
- 配置 DNS
- 高级网络配置
- 快速配置指南
- 容器访问控制
- 端口映射实现
- 配置 docker0 网桥
- 自定义网桥
- 工具和示例
- 编辑网络配置文件
- 实例:创建一个点到点连接
- Docker Compose
- 简介
- 安装与卸载
- 使用
- 命令说明
- Compose 模板文件
- 实战 Django
- 实战 Rails
- 实战 WordPress
- Swarm mode
- 基本概念
- 创建 Swarm 集群
- 部署服务
- 使用 compose 文件
- 管理密钥
- 管理配置信息
- 滚动升级
- 安全
- 内核命名空间
- 控制组
- 服务端防护
- 内核能力机制
- 其它安全特性
- 总结
- 底层实现
- 基本架构
- 命名空间
- 控制组
- 联合文件系统
- 容器格式
- 网络
- Etcd 项目
- 简介
- 安装
- 集群
- 使用 etcdctl
- CoreOS 项目
- 简介
- 工具
- Kubernetes 项目
- 简介
- 快速上手
- 基本概念
- kubectl 使用
- 架构设计
- 容器与云计算
- 简介
- 亚马逊云
- 腾讯云
- 阿里云
- 小结
- 实战案例-操作系统
- Busybox
- Alpine
- Debian Ubuntu
- CentOS Fedora
- 本章小结
- 实战案例-CI/CD
- GitHub Actions
- Drone
- 部署 Drone
- Travis CI
- Docker 开源项目
- LinuxKit
- 附录
- 附录一:常见问题总结
- 附录二:热门镜像介绍
- Ubuntu
- CentOS
- Nginx
- PHP
- Node.js
- MySQL
- WordPress
- MongoDB
- Redis
- 附录三:Docker 命令查询
- 附录四:Dockerfile 最佳实践
- 附录五:如何调试 Docker
- 附录六:资源链接
- 归档
- Mesos - 优秀的集群资源调度平台
- Mesos 简介
- 安装与使用
- 原理与架构
- Mesos 配置项解析
- 日志与监控
- 常见应用框架
- 本章小结
- Docker Machine
- 安装
- 使用
- Docker Swarm
文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
日志与监控
日志与监控
Mesos 自身提供了强大的日志和监控功能,某些应用框架也提供了针对框架中任务的监控能力。通过这些接口,用户可以实时获知集群的各种状态。
日志配置
日志文件默认在 /var/log/mesos
目录下,根据日志等级带有不同后缀。
用户可以通过日志来调试使用中碰到的问题。
一般的,推荐使用 --log_dir
选项来指定日志存放路径,并通过日志分析引擎来进行监控。
监控
Mesos 提供了方便的监控接口,供用户查看集群中各个节点的状态。
主节点
通过 http://MASTER_NODE:5050/metrics/snapshot
地址可以获取到 Mesos 主节点的各种状态统计信息,包括资源(CPU、硬盘、内存)使用、系统状态、从节点、应用框架、任务状态等。
例如查看主节点 10.0.0.2
的状态信息,并用 jq 来解析返回的 json 对象。
$ curl -s http://10.0.0.2:5050/metrics/snapshot |jq .{ "system/mem_total_bytes": 4144713728, "system/mem_free_bytes": 153071616, "system/load_5min": 0.37, "system/load_1min": 0.6, "system/load_15min": 0.29, "system/cpus_total": 4, "registrar/state_store_ms/p9999": 45.4096616192, "registrar/state_store_ms/p999": 45.399272192, "registrar/state_store_ms/p99": 45.29537792, "registrar/state_store_ms/p95": 44.8336256, "registrar/state_store_ms/p90": 44.2564352, "registrar/state_store_ms/p50": 34.362368, ... "master/recovery_slave_removals": 1, "master/slave_registrations": 0, "master/slave_removals": 0, "master/slave_removals/reason_registered": 0, "master/slave_removals/reason_unhealthy": 0, "master/slave_removals/reason_unregistered": 0, "master/slave_reregistrations": 2, "master/slave_shutdowns_canceled": 0, "master/slave_shutdowns_completed": 1, "master/slave_shutdowns_scheduled": 1}
从节点
通过 http://SLAVE_NODE:5051/metrics/snapshot
地址可以获取到 Mesos 从节点的各种状态统计信息,包括资源、系统状态、各种消息状态等。
例如查看从节点 10.0.0.10
的状态信息。
$ curl -s http://10.0.0.10:5051/metrics/snapshot |jq .{ "system/mem_total_bytes": 16827785216, "system/mem_free_bytes": 3377315840, "system/load_5min": 0.11, "system/load_1min": 0.16, "system/load_15min": 0.13, "system/cpus_total": 8, "slave/valid_status_updates": 11, "slave/valid_framework_messages": 0, "slave/uptime_secs": 954125.458927872, "slave/tasks_starting": 0, "slave/tasks_staging": 0, "slave/tasks_running": 1, "slave/tasks_lost": 0, "slave/tasks_killed": 2, "slave/tasks_finished": 0, "slave/executors_preempted": 0, "slave/executor_directory_max_allowed_age_secs": 403050.709525191, "slave/disk_used": 0, "slave/disk_total": 88929, "slave/disk_revocable_used": 0, "slave/disk_revocable_total": 0, "slave/disk_revocable_percent": 0, "slave/disk_percent": 0, "containerizer/mesos/container_destroy_errors": 0, "slave/container_launch_errors": 6, "slave/cpus_percent": 0.025, "slave/cpus_revocable_percent": 0, "slave/cpus_revocable_total": 0, "slave/cpus_revocable_used": 0, "slave/cpus_total": 8, "slave/cpus_used": 0.2, "slave/executors_registering": 0, "slave/executors_running": 1, "slave/executors_terminated": 8, "slave/executors_terminating": 0, "slave/frameworks_active": 1, "slave/invalid_framework_messages": 0, "slave/invalid_status_updates": 0, "slave/mem_percent": 0.00279552715654952, "slave/mem_revocable_percent": 0, "slave/mem_revocable_total": 0, "slave/mem_revocable_used": 0, "slave/mem_total": 15024, "slave/mem_used": 42, "slave/recovery_errors": 0, "slave/registered": 1, "slave/tasks_failed": 6}
另外,通过 http://MASTER_NODE:5050/monitor/statistics.json
地址可以看到该从节点上容器网络相关的统计数据,包括进出流量、丢包数、队列情况等。获取方法同上,在此不再演示。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论