注意

本文档适用于 Ceph 的开发版本。

Insights 模块

insights 模块收集并向 Insights Core 数据分析框架公开系统信息。它旨在取代对 Ceph CLI 和守护程序管理套接字的显式询问,从而减少 Insights 所依赖的 API 表面。insights 报告包含以下内容:

  • 健康报告。除了报告集群的当前健康状况外,insights 模块还报告了过去 24 小时内的健康检查摘要。此功能对于捕获瞬态且在生成报告时可能不存在的集群健康问题非常重要。健康检查会去重以避免数据无限增长。

  • 崩溃报告。insights 报告中包含过去 24 小时内任何守护程序崩溃的摘要。崩溃按时间窗口内每个守护程序类型(例如 ceph-osd)的崩溃次数进行报告。可以使用 crash 模块获取崩溃的完整详细信息。

  • 软件版本、存储利用率、集群地图、放置组摘要、监视器状态、集群配置和 OSD 元数据。

启用

要启用 insights 模块,请运行以下命令:

ceph mgr module enable insights

命令

要生成完整报告,请运行以下命令:

ceph insights

要删除早于 <hours> 的历史健康数据,请运行以下形式的命令。将 <hours> 设置为 0 将清除所有健康数据。

ceph insights prune-health <hours>

prune-health 子命令对于在生成自动夜间报告之前清理健康历史记录非常有用。未修剪的健康历史记录可能包含在执行系统维护期间积累的虚假健康检查以及已解决的其他健康检查。无需修剪健康数据以回收存储空间;会定期执行垃圾收集以从持久存储中删除旧的健康数据。

由 Ceph 基金会为您呈现

Ceph 文档是由非营利性 Ceph 基金会 资助和托管的社区资源。如果您希望支持这项工作和我们的其他努力,请考虑 立即加入