Openstack云平台运维手册.docx
《Openstack云平台运维手册.docx》由会员分享,可在线阅读,更多相关《Openstack云平台运维手册.docx(8页珍藏版)》请在冰豆网上搜索。
Openstack云平台运维手册
Openstack运维手册
2017年7月18日
***执行任何openstack命令之前都必须运行openstack的环境变量
source/root/admin-openrc.sh(每次新开控制台窗口必须执行一次)
一、健康检查
1、认证模块检查
openstacktokenissue
有输出即可,如输出异常
重启服务即可
serviceapache2restart
servicememcachedrestart
2、计算模块检查
novaservice-list
所有计算服务的status必须是enabled
State必须是up
如有服务存在异常,直接重启异常的服务。
servicenova-certrestart
servicenova-consoleauthrestart
servicenova-schedulerrestart
servicenova-conductorrestart
servicenova-computerestart
3、网络模块检查
neutronagent-list
所有网络服务的alive必须是:
-)
如有服务存在异常,直接重启异常的服务。
serviceneutron-plugin-openvswitch-agentrestart
serviceneutron-l3-agentrestart
serviceneutron-dhcp-agentrestart
serviceneutron-metadata-agentrestart
4、存储模块检查
cinderservice-list
所有存储服务的status必须是enabled
State必须是up
如有服务存在异常,直接重启异常的服务。
servicecinder-schedulerrestart
servicecinder-apirestart
servicecinder-volumerestart
5、镜像模块检查
glanceimage-list
有输出即可,如输出异常
重启服务即可
serviceglance-registryrestart
serviceglance-apirestart
6、检查Horizon服务
ps-ef|grepapache2
如有输出horizon用户执行apache2命令即可
如异常重启memcached
servicememcachedrestart
7、分布式存储检查
ceph–s
Health必须是HEALTH_OK
如遇到mon或者osddown
重启对应节点服务即可,查询节点命令
cephosdtree
重启服务命令
/etc/init.d/cephstartosd.x
二、运维命令
1、虚拟机开通
Ø查询现有的虚拟机模拟
novaflavor-list
Ø查询当前的虚拟机镜像
novaimage-list
Ø创建虚拟机
Novaboot--flavorname--imagename
--nicnet-id=4d42b06a-5b86-4d20-a249-4d0e9f7a8162--security-groupdefaulttest1
Ø查看虚拟机状态
novashowid
当vm_state状态显示为active时,说明虚拟机部署完毕,可以使用了
2、安全组管理
Ø创建一个安全组
novasecgroup-createtest“thisisatest”
Ø查看所有的安全组
novasecgroup-list
Ø向安全组添加规则
允许来自192.168.0.1的ICMP和ssh流量
novasecgroup-add-ruletesttcp2222192.168.0.1/0
novasecgroup-add-ruletesticmp-1-1192.168.0.1/0
Ø如果虚拟主机运行Windows系统,则添加一条允许建立TCP连接的规则
novasecgroup-add-ruletesttcp33893389192.168.0.1/0
Ø查看安全组所有配置规则
novasecgroup-list-rulestest
Ø从安全组中删除允许来自192.168.0.1的TCP流量规则
novasecgroup-delete-ruletesttcp2222192.168.0.1/0
Ø删除安全组
novasecgroup-deletetest
3、创建和挂载弹性云硬盘
Ø查看已创建的云硬盘
novavolume-list
Ø创建一块新的云硬盘,名称为test_disk,大小为10G
novavolume-create--display_nametest_disk10
Ø查看新创建云硬盘test_disk的详细信息
novavolume-showid
**注意:
新创建的云硬盘test_disk,此时还没有挂载到任何虚拟主机中。
Ø删除新创建的云硬盘
novavolume-deletea6cb97b7-145d-4acc-94ae-e3425d76254e
Ø将新创建的云硬盘test_disk挂载到指定的云主机test上
novavolume-attachtesta6cb97b7-145d-4acc-94ae-e3425d76254e
Ø将云硬盘从云主机test上卸载
novavolume-detachtesta6cb97b7-145d-4acc-94ae-e3425d76254e
4、创建网络
Ø查看所有的网络
neutronnet-list
Ø查看子网设置
neutronsubnet-list
Ø创建弹性公网IP池
neutronsubnet-createext-net10.9.0.0/24--nameext-subnet--allocation-poolstart=10.9.0.113,end=10.9.0.140--disable-dhcp--gateway10.9.0.254
Ø创建一个弹性IP给当前租户
novafloating-ip-createext-net
Ø将IP地址分配给虚拟机
novaadd-floating-ipvm_id10.1.253.164
5、镜像上传与格式转换
Ø转换成raw格式
qemu-imgconvert-fqcow2-Oraw*.img*.raw
Ø上传镜像
glanceimage-create--name"*.raw"--file*.raw--disk-formatraw--container-formatbare–progress
6、虚拟机模板管理
Ø创建虚拟机模板
novaflavor-createtestIDramdiskcpu
例:
novaflavor-createtest65121002
Ø查看虚拟机模板状态
novaflavor-list
三、日志检查
ØNova日志目录:
/var/log/nova/*.log
ØHorizon日志目录:
/var/log/apache2/*.log
ØCinder日志目录:
/var/log/cinder/*.log
ØKeystone日志目录:
/var/log/keystone/*.log
ØGlance日志目录:
/var/log/glance/*.log
ØNeutron日志目录:
/var/log/neutron/*.log
ØCeph日志目录:
/var/log/ceph/*.log
四、常见故障实战模拟
4.1、虚拟机不通
虚拟机IP不通告警,(邮件提醒ICMP10.36.8.230不通)
4.1.1、测试ICMP告警
首先自行测试IP是否通,也有可能由于网络闪断、或者负载过高导致网络异常,短暂时间会恢复
4.1.2、查找物理机
如网络确实不通,查找该虚拟机上承载的物理机信息
利用虚拟机IP调命令novalist|grep筛选出虚拟机名称和ID号
利用ID号,novashowID找出承载虚拟机的物理机。
4.1.3、物理机网络判断
由上图可以看到故障虚拟机上的物理机是comput29,在其所属成都集群上Ping主机,如果通,则进行下一步判断,如果不通,择将虚拟机迁移到其他物理机上,详细操作见后面。
4.1.3.1、物理机通、承载的虚拟机网络不通
物理主机是通的,虚拟机不通,可查找承载该物理机上的其他虚拟机网络状态是否一致
,如所有虚拟机都不通,则重启该物理机上的neutron服务。
root@compute2:
~#serviceneutron-linuxbridge-agentrestart
等十几秒后再次尝试ping故障虚拟机和其他虚拟机
如未能解决,则迁移。
4.1.3.2、物理机通、承载的虚拟机网络通
物理主机是通的,只有这台虚拟机不通,则从web页面进入操作系统,看系统是否卡死、或者系统损坏
如系统卡死,可直接重启启动、看网络状态是否恢复,可进入虚拟机操作系统,ifconfig查看;
如遇系统损坏,暂不处理。
如虚拟机重启后仍无法通,则迁移。
4.2、物理机网络不通
无论物理机是宕机还是网卡异常。
直接将物理机上的虚拟机疏散(迁移)出去。
目标主机要在管理程序上找比较空闲的机器进行疏散
疏散后切换到选择的物理机查看迁移后的状态,测试网络是否正常,如不正常则手动重启虚拟机。
4.2.1、疏散后状态异常
如迁移后虚拟机状态异常,则后台修改数据库。
Mysql-uroot-p-h10.36.1.100(10.36.2.100\10.36.3.100)
Usenova;
updateinstancessetpower_state='4',vm_state='stopped'whereuuid='1329434e-715d-48c8-aa80-f066ac809873';
直接启动即可。
4.2.2、疏散失败
如果疏散失败,则手动修改数据库进行人工迁移。
(疏散失败就是一直在原来的物理机)
修改数据库信息后手动重启虚拟机。
Mysql-uroot-p-h10.36.1.100(10.36.2.100\10.36.3.100)
Usenova;
updateinstancessetpower_state='4',vm_state='stopped',host='compute39',launched_on='compute39',node='compute39'whereuuid='1329434e-715d-48c8-aa80-f066ac809873';
4.2.3、疏散失败导致任务状态异常
如遇到任务一直卡主某个状态,刷新数据库,正常状态是无。
Mysql-uroot–p
Usenova;
#updateinstancessettask_state=null;