Openstack云平台运维手册.docx

资源描述

Openstack云平台运维手册.docx

《Openstack云平台运维手册.docx》由会员分享，可在线阅读，更多相关《Openstack云平台运维手册.docx（8页珍藏版）》请在冰豆网上搜索。

Openstack云平台运维手册.docx

Openstack云平台运维手册

Openstack运维手册

2017年7月18日

***执行任何openstack命令之前都必须运行openstack的环境变量

source/root/admin-openrc.sh（每次新开控制台窗口必须执行一次）

一、健康检查

1、认证模块检查

openstacktokenissue

有输出即可，如输出异常

重启服务即可

serviceapache2restart

servicememcachedrestart

2、计算模块检查

novaservice-list

所有计算服务的status必须是enabled

State必须是up

如有服务存在异常，直接重启异常的服务。

servicenova-certrestart

servicenova-consoleauthrestart

servicenova-schedulerrestart

servicenova-conductorrestart

servicenova-computerestart

3、网络模块检查

neutronagent-list

所有网络服务的alive必须是:

-）

如有服务存在异常，直接重启异常的服务。

serviceneutron-plugin-openvswitch-agentrestart

serviceneutron-l3-agentrestart

serviceneutron-dhcp-agentrestart

serviceneutron-metadata-agentrestart

4、存储模块检查

cinderservice-list

所有存储服务的status必须是enabled

State必须是up

如有服务存在异常，直接重启异常的服务。

servicecinder-schedulerrestart

servicecinder-apirestart

servicecinder-volumerestart

5、镜像模块检查

glanceimage-list

有输出即可，如输出异常

重启服务即可

serviceglance-registryrestart

serviceglance-apirestart

6、检查Horizon服务

ps-ef|grepapache2

如有输出horizon用户执行apache2命令即可

如异常重启memcached

servicememcachedrestart

7、分布式存储检查

ceph–s

Health必须是HEALTH_OK

如遇到mon或者osddown

重启对应节点服务即可，查询节点命令

cephosdtree

重启服务命令

/etc/init.d/cephstartosd.x

二、运维命令

1、虚拟机开通

Ø查询现有的虚拟机模拟

novaflavor-list

Ø查询当前的虚拟机镜像

novaimage-list

Ø创建虚拟机

Novaboot--flavorname--imagename

--nicnet-id=4d42b06a-5b86-4d20-a249-4d0e9f7a8162--security-groupdefaulttest1

Ø查看虚拟机状态

novashowid

当vm_state状态显示为active时，说明虚拟机部署完毕，可以使用了

2、安全组管理

Ø创建一个安全组

novasecgroup-createtest“thisisatest”

Ø查看所有的安全组

novasecgroup-list

Ø向安全组添加规则

允许来自192.168.0.1的ICMP和ssh流量

novasecgroup-add-ruletesttcp2222192.168.0.1/0

novasecgroup-add-ruletesticmp-1-1192.168.0.1/0

Ø如果虚拟主机运行Windows系统，则添加一条允许建立TCP连接的规则

novasecgroup-add-ruletesttcp33893389192.168.0.1/0

Ø查看安全组所有配置规则

novasecgroup-list-rulestest

Ø从安全组中删除允许来自192.168.0.1的TCP流量规则

novasecgroup-delete-ruletesttcp2222192.168.0.1/0

Ø删除安全组

novasecgroup-deletetest

3、创建和挂载弹性云硬盘

Ø查看已创建的云硬盘

novavolume-list

Ø创建一块新的云硬盘，名称为test_disk，大小为10G

novavolume-create--display_nametest_disk10

Ø查看新创建云硬盘test_disk的详细信息

novavolume-showid

**注意：

新创建的云硬盘test_disk，此时还没有挂载到任何虚拟主机中。

Ø删除新创建的云硬盘

novavolume-deletea6cb97b7-145d-4acc-94ae-e3425d76254e

Ø将新创建的云硬盘test_disk挂载到指定的云主机test上

novavolume-attachtesta6cb97b7-145d-4acc-94ae-e3425d76254e

Ø将云硬盘从云主机test上卸载

novavolume-detachtesta6cb97b7-145d-4acc-94ae-e3425d76254e

4、创建网络

Ø查看所有的网络

neutronnet-list

Ø查看子网设置

neutronsubnet-list

Ø创建弹性公网IP池

neutronsubnet-createext-net10.9.0.0/24--nameext-subnet--allocation-poolstart=10.9.0.113,end=10.9.0.140--disable-dhcp--gateway10.9.0.254

Ø创建一个弹性IP给当前租户

novafloating-ip-createext-net

Ø将IP地址分配给虚拟机

novaadd-floating-ipvm_id10.1.253.164

5、镜像上传与格式转换

Ø转换成raw格式

qemu-imgconvert-fqcow2-Oraw*.img*.raw

Ø上传镜像

glanceimage-create--name"*.raw"--file*.raw--disk-formatraw--container-formatbare–progress

6、虚拟机模板管理

Ø创建虚拟机模板

novaflavor-createtestIDramdiskcpu

例：

novaflavor-createtest65121002

Ø查看虚拟机模板状态

novaflavor-list

三、日志检查

ØNova日志目录：

/var/log/nova/*.log

ØHorizon日志目录：

/var/log/apache2/*.log

ØCinder日志目录：

/var/log/cinder/*.log

ØKeystone日志目录：

/var/log/keystone/*.log

ØGlance日志目录：

/var/log/glance/*.log

ØNeutron日志目录：

/var/log/neutron/*.log

ØCeph日志目录：

/var/log/ceph/*.log

四、常见故障实战模拟

4.1、虚拟机不通

虚拟机IP不通告警，（邮件提醒ICMP10.36.8.230不通）

4.1.1、测试ICMP告警

首先自行测试IP是否通，也有可能由于网络闪断、或者负载过高导致网络异常，短暂时间会恢复

4.1.2、查找物理机

如网络确实不通，查找该虚拟机上承载的物理机信息

利用虚拟机IP调命令novalist|grep筛选出虚拟机名称和ID号

利用ID号，novashowID找出承载虚拟机的物理机。

4.1.3、物理机网络判断

由上图可以看到故障虚拟机上的物理机是comput29，在其所属成都集群上Ping主机，如果通，则进行下一步判断，如果不通，择将虚拟机迁移到其他物理机上，详细操作见后面。

4.1.3.1、物理机通、承载的虚拟机网络不通

物理主机是通的，虚拟机不通，可查找承载该物理机上的其他虚拟机网络状态是否一致

，如所有虚拟机都不通，则重启该物理机上的neutron服务。

root@compute2:

~#serviceneutron-linuxbridge-agentrestart

等十几秒后再次尝试ping故障虚拟机和其他虚拟机

如未能解决，则迁移。

4.1.3.2、物理机通、承载的虚拟机网络通

物理主机是通的，只有这台虚拟机不通，则从web页面进入操作系统，看系统是否卡死、或者系统损坏

如系统卡死，可直接重启启动、看网络状态是否恢复，可进入虚拟机操作系统，ifconfig查看；

如遇系统损坏，暂不处理。

如虚拟机重启后仍无法通，则迁移。

4.2、物理机网络不通

无论物理机是宕机还是网卡异常。

直接将物理机上的虚拟机疏散（迁移）出去。

目标主机要在管理程序上找比较空闲的机器进行疏散

疏散后切换到选择的物理机查看迁移后的状态，测试网络是否正常，如不正常则手动重启虚拟机。

4.2.1、疏散后状态异常

如迁移后虚拟机状态异常，则后台修改数据库。

Mysql-uroot-p-h10.36.1.100（10.36.2.100\10.36.3.100）

Usenova;

updateinstancessetpower_state='4',vm_state='stopped'whereuuid='1329434e-715d-48c8-aa80-f066ac809873';

直接启动即可。

4.2.2、疏散失败

如果疏散失败，则手动修改数据库进行人工迁移。

（疏散失败就是一直在原来的物理机）

修改数据库信息后手动重启虚拟机。

Mysql-uroot-p-h10.36.1.100（10.36.2.100\10.36.3.100）

Usenova;

updateinstancessetpower_state='4',vm_state='stopped',host='compute39',launched_on='compute39',node='compute39'whereuuid='1329434e-715d-48c8-aa80-f066ac809873';

4.2.3、疏散失败导致任务状态异常

如遇到任务一直卡主某个状态，刷新数据库，正常状态是无。

Mysql-uroot–p

Usenova;

#updateinstancessettask_state=null;

展开阅读全文