Openstack云平台运维手册.docx
《Openstack云平台运维手册.docx》由会员分享,可在线阅读,更多相关《Openstack云平台运维手册.docx(11页珍藏版)》请在冰豆网上搜索。
Openstack云平台运维手册
Openstack运维手册
2017年7月18日
***执行任何openstack命令之前都必须运行openstack的环境变量
source/root/(每次新开控制台窗口必须执行一次)
一、健康检查
1、认证模块检查
openstacktokenissue
有输出即可,如输出异常
重启服务即可
serviceapache2restart
servicememcachedrestart
2、计算模块检查
novaservice-list
所有计算服务的status必须是enabled
State必须是up
如有服务存在异常,直接重启异常的服务。
servicenova-certrestart
servicenova-consoleauthrestart
servicenova-schedulerrestart
servicenova-conductorrestart
servicenova-computerestart
3、网络模块检查
neutronagent-list
所有网络服务的alive必须是:
-)
如有服务存在异常,直接重启异常的服务。
serviceneutron-plugin-openvswitch-agentrestart
serviceneutron-l3-agentrestart
serviceneutron-dhcp-agentrestart
serviceneutron-metadata-agentrestart
4、存储模块检查
cinderservice-list
所有存储服务的status必须是enabled
State必须是up
如有服务存在异常,直接重启异常的服务。
servicecinder-schedulerrestart
servicecinder-apirestart
servicecinder-volumerestart
5、镜像模块检查
glanceimage-list
有输出即可,如输出异常
重启服务即可
serviceglance-registryrestart
serviceglance-apirestart
6、检查Horizon服务
ps-ef|grepapache2
如有输出horizon用户执行apache2命令即可
如异常重启memcached
servicememcachedrestart
7、分布式存储检查
ceph–s
Health必须是HEALTH_OK
如遇到mon或者osddown
重启对应节点服务即可,查询节点命令
cephosdtree
重启服务命令
/etc/cephstart
二、运维命令
1、虚拟机开通
查询现有的虚拟机模拟
novaflavor-list
查询当前的虚拟机镜像
novaimage-list
创建虚拟机
Novaboot--flavorname--imagename
--nicnet-id=4d42b06a-5b86-4d20-a249-4d0e9f7a8162--security-groupdefaulttest1
查看虚拟机状态
novashowid
当vm_state状态显示为active时,说明虚拟机部署完毕,可以使用了
2、安全组管理
创建一个安全组
novasecgroup-createtest“thisisatest”
查看所有的安全组
novasecgroup-list
向安全组添加规则
允许来自的ICMP和ssh流量
novasecgroup-add-ruletesttcp2222
novasecgroup-add-ruletesticmp-1-1如果虚拟主机运行Windows系统,则添加一条允许建立TCP连接的规则
novasecgroup-add-ruletesttcp33893389查看安全组所有配置规则
novasecgroup-list-rulestest
从安全组中删除允许来自的TCP流量规则
novasecgroup-delete-ruletesttcp2222删除安全组
novasecgroup-deletetest
3、创建和挂载弹性云硬盘
查看已创建的云硬盘
novavolume-list
创建一块新的云硬盘,名称为test_disk,大小为10G
novavolume-create--display_nametest_disk10
查看新创建云硬盘test_disk的详细信息
novavolume-showid
**注意:
新创建的云硬盘test_disk,此时还没有挂载到任何虚拟主机中。
删除新创建的云硬盘
novavolume-deletea6cb97b7-145d-4acc-94ae-e3425d76254e
将新创建的云硬盘test_disk挂载到指定的云主机test上
novavolume-attachtesta6cb97b7-145d-4acc-94ae-e3425d76254e
将云硬盘从云主机test上卸载
novavolume-detachtesta6cb97b7-145d-4acc-94ae-e3425d76254e
4、创建网络
查看所有的网络
neutronnet-list
查看子网设置
neutronsubnet-list
创建弹性公网IP池
neutronsubnet-createext-net--nameext-subnet--allocation-poolstart=--disable-dhcp--gateway创建一个弹性IP给当前租户
novafloating-ip-createext-net
将IP地址分配给虚拟机
novaadd-floating-ipvm_id、镜像上传与格式转换
转换成raw格式
qemu-imgconvert-fqcow2-Oraw*.img*.raw
上传镜像
glanceimage-create--name"*.raw"--file*.raw--disk-formatraw--container-formatbare–progress
6、虚拟机模板管理
创建虚拟机模板
novaflavor-createtestIDramdiskcpu
例:
novaflavor-createtest65121002
查看虚拟机模板状态
novaflavor-list
三、日志检查
Nova日志目录:
/var/log/nova/*.log
Horizon日志目录:
/var/log/apache2/*.log
Cinder日志目录:
/var/log/cinder/*.log
Keystone日志目录:
/var/log/keystone/*.log
Glance日志目录:
/var/log/glance/*.log
Neutron日志目录:
/var/log/neutron/*.log
Ceph日志目录:
/var/log/ceph/*.log
四、常见故障实战模拟
、虚拟机不通
虚拟机IP不通告警,(邮件提醒ICMP不通)
、测试ICMP告警
首先自行测试IP是否通,也有可能由于网络闪断、或者负载过高导致网络异常,短暂时间会恢复
、查找物理机
如网络确实不通,查找该虚拟机上承载的物理机信息
利用虚拟机IP调命令novalist|grep筛选出虚拟机名称和ID号
利用ID号,novashowID找出承载虚拟机的物理机。
、物理机网络判断
由上图可以看到故障虚拟机上的物理机是comput29,在其所属成都集群上Ping主机,如果通,则进行下一步判断,如果不通,择将虚拟机迁移到其他物理机上,详细操作见后面。
、物理机通、承载的虚拟机网络不通
物理主机是通的,虚拟机不通,可查找承载该物理机上的其他虚拟机网络状态是否一致
,如所有虚拟机都不通,则重启该物理机上的neutron服务。
root@compute2:
~#serviceneutron-linuxbridge-agentrestart
等十几秒后再次尝试ping故障虚拟机和其他虚拟机
如未能解决,则迁移。
、物理机通、承载的虚拟机网络通
物理主机是通的,只有这台虚拟机不通,则从web页面进入操作系统,看系统是否卡死、或者系统损坏
如系统卡死,可直接重启启动、看网络状态是否恢复,可进入虚拟机操作系统,ifconfig查看;
如遇系统损坏,暂不处理。
如虚拟机重启后仍无法通,则迁移。
、物理机网络不通
无论物理机是宕机还是网卡异常。
直接将物理机上的虚拟机疏散(迁移)出去。
目标主机要在管理程序上找比较空闲的机器进行疏散
疏散后切换到选择的物理机查看迁移后的状态,测试网络是否正常,如不正常则手动重启虚拟机。
、疏散后状态异常
如迁移后虚拟机状态异常,则后台修改数据库。
Mysql-uroot-p-hnova;
updateinstancessetpower_state='4',vm_state='stopped'whereuuid='1329434e-715d-48c8-aa80-f066ac809873';
直接启动即可。
、疏散失败
如果疏散失败,则手动修改数据库进行人工迁移。
(疏散失败就是一直在原来的物理机)
修改数据库信息后手动重启虚拟机。
Mysql-uroot-p-hnova;
updateinstancessetpower_state='4',vm_state='stopped',host='compute39',launched_on='compute39',node='compute39'whereuuid='1329434e-715d-48c8-aa80-f066ac809873';
、疏散失败导致任务状态异常
如遇到任务一直卡主某个状态,刷新数据库,正常状态是无。
Mysql-uroot–p
Usenova;
#updateinstancessettask_state=null;