本文转载自:http://www.mooooc.com/mongodb/2017/09/06/mongodb-operation.html
这篇文件介绍如何动态的添加、下架mongod分片和副本集,以及如何监控和运维mongodb。
添加节点
副本集 改为仲裁节点
convert-secondary-into-arbiter
登录
1 | mongo 192.168.0.35:27005 |
1 | #查看分区状态 |
移除副本集
1 | rs.remove("192.168.0.35:27005") |
查看配置
1 | rs.conf() |
删除shard5的数据目录,重启shard5
重新添加仲裁节点
1 | rs.addArb("192.168.0.35:27005") |
查看配置
1 | rs.conf() |
仲裁节点改成副本集
移除仲裁节点
1 | rs.remove("192.168.0.35:27005") |
删除总裁节点的数据,并重启
在 primary 添加副本节点
1 | rs.add("192.168.0.35:27005") |
1 | rs.conf() |
刚添加的副本集状态为:STARTUP2
1 | "stateStr" : "STARTUP2", |
集群中添加分片
1 | mongo 192.168.0.31:20000 |
监控
mongostat
mongostat是mongdb自带的状态检测工具,在命令行下使用。它会间隔固定时间获取mongodb的当前运行状态,并输出。如果你发现数据库突然变慢或者有其他问题的话,你第一手的操作就考虑采用mongostat来查看mongo的状态。
它的输出有以下几列:
- inserts/s 每秒插入次数
- query/s 每秒查询次数
- update/s 每秒更新次数
- delete/s 每秒删除次数
- getmore/s 每秒执行getmore次数
- command/s 每秒的命令数,比以上插入、查找、更新、删除的综合还多,还统计了别的命令
- flushs/s 每秒执行fsync将数据写入硬盘的次数。
- mapped/s 所有的被mmap的数据量,单位是MB,
- vsize 虚拟内存使用量,单位MB
- res 物理内存使用量,单位MB
- faults/s 每秒访问失败数(只有Linux有),数据被交换出物理内存,放到swap。不要超过100,否则就是机器内存太小,造成频繁swap写入。此时要升级内存或者扩展
- locked % 被锁的时间百分比,尽量控制在50%以下吧
- idx miss % 索引不命中所占百分比。如果太高的话就要考虑索引是不是少了
q t|r|w
当Mongodb接收到太多的命令而数据库被锁住无法执行完成,它会将命令加入队列。这一栏显示了总共、读、写3个队列的长度,都为0的话表示mongo毫无压力。高并发时,一般队列值会升高。- conn 当前连接数
- time 时间戳
示例:
1 | mongostat -h 192.168.0.31:27001 |
mongostat间隔时间刷新mongodb分片的各项操作。
mongotop
mongotop用来跟踪MongoDB的实例, 提供每个集合的统计数据。默认情况下,mongotop每一秒刷新一次。
mongotop用法:
1 | mongotop -h 192.168.0.31:27001 10 |
后面的10是
mongotop –locks
报告每个数据库的锁的使用中,使用mongotop - 锁,这将产生以下输出:
结果字段介绍:
ns:包含数据库命名空间,后者结合了数据库名称和集合。
db:包含数据库的名称。名为 . 的数据库针对全局锁定,而非特定数据库。
total:mongod花费的时间工作在这个命名空间提供总额。
read:提供了大量的时间,这mongod花费在执行读操作,在此命名空间。
write:提供这个命名空间进行写操作,这mongod花了大量的时间。
profiler
类似于MySQL的slow log, MongoDB可以监控所有慢的以及不慢的查询。
Profiler默认是关闭的,你可以选择全部开启,或者有慢查询的时候开启。
1 | > use test |
查看Profile日志
1 | > db.system.profile.find().sort({$natural:-1}) |
1 | #查看系统中的慢查询数量 |
3个字段的意义
- ts:时间戳
- info:具体的操作
- millis:操作所花时间,毫秒
注意,造成满查询可能是索引的问题,也可能是数据不在内存造成因此磁盘读入造成。
db.serverStatus()
db.serverStatus()
获取服务器的状态
1 | { |
需要关心的地方:
- connections 当前连接和可用连接数,听过一个同行介绍过,mongodb最大处理到2000个连接就不行了(要根据你的机器性能和业务来设定),所以设大了没意义。设个合理值的话,到达这个值mongodb就拒绝新的连接请求,避免被太多的连接拖垮。
- indexCounters:btree:misses 索引的不命中数,和hits的比例高就要考虑索引是否正确建立。你看我的”missRatio”3.543930204420982e-7,很健康吧。所以miss率在mongostat里面也可以看
- 其他的都能自解释,也不是查看mongo健康状况的关键,就不说明了。
详细的解释参考这里:serverStatus
db.currentOp()
Mongodb 的命令一般很快就完成,但是在一台繁忙的机器或者有比较慢的命令时,你可以通过db.currentOp()获取当前正在执行的操作。
在没有负载的机器上,该命令基本上都是返回空的
1 | > db.currentOp() |
以下是一个有负载的机器上得到的返回值样例:
1 | { "opid" : "shard3:466404288", "active" : false, "waitingForLock" : false, "op" : "query", "ns" : "sd.usersEmails", "query" : { }, "client_s" : "10.121.13.8:34473", "desc" : "conn" }, |
字段名字都能自解释。如果你发现一个操作太长,把数据库卡死的话,可以用这个命令杀死他
1 | > db.killOp("shard3:466404288") |