[errno 2] error connecting to the cluster
解释
安装 ceph 集群之后执行ceph -s
报错如上,这个是因为认证文件没有分发到个节点导致的无法认证。
解决方案
ceph-deploy admin admin-node node1 [noden] # 后面跟你集群中的所有节点名 |
daemons have recently crashed
解释
一个或多个 Ceph 守护进程最近崩溃了,管理员还没有存档(确认)这个崩溃。这可能表示软件错误、硬件问题(例如,故障磁盘)或其他问题。
解决方案
- 查看 crash 信息
ceph crash ls-new
- 查看归档信息
ceph crash info <crash-id>
- 归档 crash 信息你也可以使用
ceph crash archive <crash-id>
ceph crash archive-all
命令归档 所有信息
更多参考:
- Crash Module — Ceph Documentation
- ceph 报 daemons have recently crashed_网络_lyf0327 的博客-CSDN 博客
xx is not defined in
执行mon initial members
ceph-deploy mon add xx
添加 mon 节点时报错如下:[node3][WARNIN] node3 is not defined in `mon initial members`
[node3][WARNIN] monitor node3 does not exist in monmap解释
添加的 mon 节点不是初始化成员,集群无法识别解决方案
修改配置文件添加public network = 172.18.1.0/24
(网段需要根据实际情况修改)并将配置文件同步到新加节点ceph-deploy --overwrite-conf config push xxx