Openstack云平台运维手册.docx

资源描述

Openstack云平台运维手册.docx

《Openstack云平台运维手册.docx》由会员分享，可在线阅读，更多相关《Openstack云平台运维手册.docx（11页珍藏版）》请在冰豆网上搜索。

Openstack云平台运维手册.docx

Openstack云平台运维手册

Openstack运维手册

2017年7月18日

Openstack运维手册1

一、健康检查3

1、认证模块检查3

2、计算模块检查3

3、网络模块检查4

4、存储模块检查4

5、镜像模块检查5

6、检查Horizon服务5

7、分布式存储检查5

二、运维命令6

1、虚拟机开通6

2、安全组管理6

3、创建和挂载弹性云硬盘7

4、创建网络7

5、镜像上传与格式转换8

6、虚拟机模板管理8

三、日志检查8

四、常见故障实战模拟9

4.1、虚拟机不通9

4.1.1、测试ICMP告警9

4.1.2、查找物理机9

4.1.3、物理机网络判断10

4.1.3.1、物理机通、承载的虚拟机网络不通10

4.1.3.2、物理机通、承载的虚拟机网络通10

4.2、物理机网络不通10

4.2.1、疏散后状态异常11

4.2.2、疏散失败12

4.2.3、疏散失败导致任务状态异常12

***执行任何openstack命令之前都必须运行openstack的环境变量

source/root/admin-openrc.sh（每次新开控制台窗口必须执行一次）

一、健康检查

1、认证模块检查

openstacktokenissue

有输出即可，如输出异常

重启服务即可

serviceapache2restart

servicememcachedrestart

2、计算模块检查

novaservice-list

所有计算服务的status必须是enabled

State必须是up

如有服务存在异常，直接重启异常的服务。

servicenova-certrestart

servicenova-consoleauthrestart

servicenova-schedulerrestart

servicenova-conductorrestart

servicenova-computerestart

3、网络模块检查

neutronagent-list

所有网络服务的alive必须是:

-）

如有服务存在异常，直接重启异常的服务。

serviceneutron-plugin-openvswitch-agentrestart

serviceneutron-l3-agentrestart

serviceneutron-dhcp-agentrestart

serviceneutron-metadata-agentrestart

4、存储模块检查

cinderservice-list

所有存储服务的status必须是enabled

State必须是up

如有服务存在异常，直接重启异常的服务。

servicecinder-schedulerrestart

servicecinder-apirestart

servicecinder-volumerestart

5、镜像模块检查

glanceimage-list

有输出即可，如输出异常

重启服务即可

serviceglance-registryrestart

serviceglance-apirestart

6、检查Horizon服务

ps-ef|grepapache2

如有输出horizon用户执行apache2命令即可

如异常重启memcached

servicememcachedrestart

7、分布式存储检查

ceph–s

Health必须是HEALTH_OK

如遇到mon或者osddown

重启对应节点服务即可，查询节点命令

cephosdtree

重启服务命令

/etc/init.d/cephstartosd.x

二、运维命令

1、虚拟机开通

查询现有的虚拟机模拟

novaflavor-list

查询当前的虚拟机镜像

novaimage-list

创建虚拟机

Novaboot--flavorname--imagename

--nicnet-id=4d42b06a-5b86-4d20-a249-4d0e9f7a8162--security-groupdefaulttest1

查看虚拟机状态

novashowid

当vm_state状态显示为active时，说明虚拟机部署完毕，可以使用了

2、安全组管理

创建一个安全组

novasecgroup-createtest“thisisatest”

查看所有的安全组

novasecgroup-list

向安全组添加规则

允许来自192.168.0.1的ICMP和ssh流量

novasecgroup-add-ruletesttcp2222192.168.0.1/0

novasecgroup-add-ruletesticmp-1-1192.168.0.1/0

如果虚拟主机运行Windows系统，则添加一条允许建立TCP连接的规则

novasecgroup-add-ruletesttcp33893389192.168.0.1/0

查看安全组所有配置规则

novasecgroup-list-rulestest

从安全组中删除允许来自192.168.0.1的TCP流量规则

novasecgroup-delete-ruletesttcp2222192.168.0.1/0

删除安全组

novasecgroup-deletetest

3、创建和挂载弹性云硬盘

查看已创建的云硬盘

novavolume-list

创建一块新的云硬盘，名称为test_disk，大小为10G

novavolume-create--display_nametest_disk10

查看新创建云硬盘test_disk的详细信息

novavolume-showid

**注意：

新创建的云硬盘test_disk，此时还没有挂载到任何虚拟主机中。

删除新创建的云硬盘

novavolume-deletea6cb97b7-145d-4acc-94ae-e3425d76254e

将新创建的云硬盘test_disk挂载到指定的云主机test上

novavolume-attachtesta6cb97b7-145d-4acc-94ae-e3425d76254e

将云硬盘从云主机test上卸载

novavolume-detachtesta6cb97b7-145d-4acc-94ae-e3425d76254e

4、创建网络

查看所有的网络

neutronnet-list

查看子网设置

neutronsubnet-list

创建弹性公网IP池

neutronsubnet-createext-net10.9.0.0/24--nameext-subnet--allocation-poolstart=10.9.0.113,end=10.9.0.140--disable-dhcp--gateway10.9.0.254

创建一个弹性IP给当前租户

novafloating-ip-createext-net

将IP地址分配给虚拟机

novaadd-floating-ipvm_id10.1.253.164

5、镜像上传与格式转换

转换成raw格式

qemu-imgconvert-fqcow2-Oraw*.img*.raw

上传镜像

glanceimage-create--name"*.raw"--file*.raw--disk-formatraw--container-formatbare–progress

6、虚拟机模板管理

创建虚拟机模板

novaflavor-createtestIDramdiskcpu

例：

novaflavor-createtest65121002

查看虚拟机模板状态

novaflavor-list

三、日志检查

Nova日志目录：

/var/log/nova/*.log

Horizon日志目录：

/var/log/apache2/*.log

Cinder日志目录：

/var/log/cinder/*.log

Keystone日志目录：

/var/log/keystone/*.log

Glance日志目录：

/var/log/glance/*.log

Neutron日志目录：

/var/log/neutron/*.log

Ceph日志目录：

/var/log/ceph/*.log

四、常见故障实战模拟

4.1、虚拟机不通

虚拟机IP不通告警，（邮件提醒ICMP10.36.8.230不通）

4.1.1、测试ICMP告警

首先自行测试IP是否通，也有可能由于网络闪断、或者负载过高导致网络异常，短暂时间会恢复

4.1.2、查找物理机

如网络确实不通，查找该虚拟机上承载的物理机信息

利用虚拟机IP调命令novalist|grep筛选出虚拟机名称和ID号

利用ID号，novashowID找出承载虚拟机的物理机。

4.1.3、物理机网络判断

由上图可以看到故障虚拟机上的物理机是comput29，在其所属成都集群上Ping主机，如果通，则进行下一步判断，如果不通，择将虚拟机迁移到其他物理机上，详细操作见后面。

4.1.3.1、物理机通、承载的虚拟机网络不通

物理主机是通的，虚拟机不通，可查找承载该物理机上的其他虚拟机网络状态是否一致

，如所有虚拟机都不通，则重启该物理机上的neutron服务。

root@compute2:

~#serviceneutron-linuxbridge-agentrestart

等十几秒后再次尝试ping故障虚拟机和其他虚拟机

如未能解决，则迁移。

4.1.3.2、物理机通、承载的虚拟机网络通

物理主机是通的，只有这台虚拟机不通，则从web页面进入操作系统，看系统是否卡死、或者系统损坏

如系统卡死，可直接重启启动、看网络状态是否恢复，可进入虚拟机操作系统，ifconfig查看；

如遇系统损坏，暂不处理。

如虚拟机重启后仍无法通，则迁移。

4.2、物理机网络不通

无论物理机是宕机还是网卡异常。

直接将物理机上的虚拟机疏散（迁移）出去。

目标主机要在管理程序上找比较空闲的机器进行疏散

疏散后切换到选择的物理机查看迁移后的状态，测试网络是否正常，如不正常则手动重启虚拟机。

4.2.1、疏散后状态异常

如迁移后虚拟机状态异常，则后台修改数据库。

Mysql-uroot-p-h10.36.1.100（10.36.2.100\10.36.3.100）

Usenova;

updateinstancessetpower_state='4',vm_state='stopped'whereuuid='1329434e-715d-48c8-aa80-f066ac809873';

直接启动即可。

4.2.2、疏散失败

如果疏散失败，则手动修改数据库进行人工迁移。

（疏散失败就是一直在原来的物理机）

修改数据库信息后手动重启虚拟机。

Mysql-uroot-p-h10.36.1.100（10.36.2.100\10.36.3.100）

Usenova;

updateinstancessetpower_state='4',vm_state='stopped',host='compute39',launched_on='compute39',node='compute39'whereuuid='1329434e-715d-48c8-aa80-f066ac809873';

4.2.3、疏散失败导致任务状态异常

如遇到任务一直卡主某个状态，刷新数据库，正常状态是无。

Mysql-uroot–p

Usenova;

#updateinstancessettask_state=null;

展开阅读全文