M26现场调测记录表IIN.docx
《M26现场调测记录表IIN.docx》由会员分享,可在线阅读,更多相关《M26现场调测记录表IIN.docx(35页珍藏版)》请在冰豆网上搜索。
M26现场调测记录表IIN
现场调测记录表(智能网IIN部分)
工程名称
工程督导
工程号
测试日期
一.SMPSYS性能指标测试
备注:
本表适用于HP及其SUN的机型,对已经开通的设备会造成不良影响的项目不用测试。
SMPSYS地点:
项目
方法和要求
指标
结果
备注
日
常
操
作
1.查看SMP个进程是否运行正常
su–smpsys
procs
正常
□是□否
2.查看双机是否运行正常
HP机型su-
cmviewcl-v
SUN机型su–
Hastat|more
IBM机型su-
/usr/sbin/cluster/clstat–a
lssrc-gcluster
lssrc-sappsy
正常
□是□否
3.查看数据库是否运行正常
su-sms
onstat-
正常
□是□否
4.查看文件系统空间是否正常
su-sms
HP机器bdf
SUN机器df-k
正常
□是□否
5.查看数据库空间是否正常
su-sms
onstat-d
正常
□是□否
6.查看数据库逻辑日志是否正常
su-sms
onstat-l
正常
□是□否
7、检查网卡状况
(IBM)Lsdev-Ccadapter|grepent
(HP)ioscan-fnClan
Lanscan
(SUN)hastat|more
正常
□是□否
8、检查CPU状态
(IBM)lsdev-Ccprocessor
(HP)ioscan-fnCprocessor
(SUN)/usr/platform/sun4u/sbin/prtdiag
正常
□是□否
9、检查内存及其使用状态状态
(IBM)lsdev-Ccmemory
lsattr-Elmem0
Topas
(HP)top
(SUN)dmesg
Top
正常
□是□否
10、检查SMP实体与scp、smap等实体的端口链接是否正常
正常
□是□否
功
能
查
询
1.查看PACKAGE倒换是否正常
su–smpsys
stop_sms
正常
□是□否
2.查看start_sms能否把被kill掉的进程重新掉起(不包括OAM进程)
su-sms
kill-9PID
正常
□是□否
5.查看数据网卡,heartbeat网卡和备网卡倒换是否正常
正常
□是□否
文
件
查
询
1.查看$INFORMIX/online.log是否有异常情况,尤其注意checkpoint的时长
正常
□是□否
2.查看$INFORMIX/etc/sqlhosts
/etc/services/etc/hosts
文件是否正确
正常
□是□否
3.查看$INFORMIX/etc/onconfig配置
是否合理
正常
□是□否
4.查看操作系统日志文件
(HP)/var/adm/syslog/syslog.log
(SUN)/var/adm/messges*
(IBM)view/var/spool/mail/root
是否有异常情况
正常
□是□否
5、以smpsys用户登录主机核查配置
~/.cshrc
~/smp_run/bin/inetcfg.cfg
正常
□是□否
6、查看$SMP_DIR/runlog及其abnormal目录下的日志文件内容中是否有异常情况
正常
□是□否
系
统
查
询
1.CPU占用率
top或者sar6060
CPU的平均占用率是否大于80%
正常
□是□否
2、操作系统核心参数配置是否正确
(HP)
用sam选择ConfigurableParameters
(SUN:
)
more/etc/system
正常
□是□否
3、SMPsys数据库各表的结构检查
用smpsys用户执行命令:
dbschema-dsmp的数据库名-sssmp.sql
再检查smp.sql文件basetab_xxx、record100的锁模式及其nextextentsize、索引等是否正确
正常
□是□否
4、检查系统的swap分区的大小
当实际内存少于256MB时,交换区的大小应是实际内存大小的两倍。
实际内存为256MB时,交换区的大小一般设为512MB。
实际内存为512MB时,交换区的大小一般设为1GB。
实际内存为1GB时,交换区的大小则应设为1.5GB。
HP:
root用户执行swapinfo-t
SUN:
root用户执行swap–s
IBM:
root用户执行lsps-a
正常
□是□否
5、双机时间一致性检查
在主备机上用date命令分别查询主机时间,时间差应小于1分钟。
正常
□是□否
计
费
查
询
1.查看数据库话单表是否有超过30分钟的话单,举例如下:
具体表名根据实际情况而定。
su–smpsys
echo"selectcount(*)fromrecord100
whereduration>='30';"|dbaccessinsms
正常
□是□否
2.查看能否不输入用户和口令直接ftp到SCP
su–smpsys
ftp-iscp
正常
□是□否
3.查看有无异常话单
正常
□是□否
硬
件
查
询
1.机房温度和湿度是否正常
正常
□是□否
2.电源是否合适
正常
□是□否
3.机柜是否接地线
正常
□是□否
二.SCU性能指标测试
备注:
本表适用于HP、IBM、SUN的机型系列,对已经开通的设备会造成不良影响的项目不用测试。
SCU地点:
项目
方法和要求
指标
结果
备注
日
常
操
作
1.查看个进程是否运行正常
su–scu
p
正常
□是□否
2.MEM板倒换时,OAM能否告警
正常
□是□否
3.双机倒换时,OAM能否告警
正常
□是□否
4.查看SCP和MEM板、SMP、双机之间是否连接正常
netstat-a|grep10000
netstat-a|grep10001
netstat-a|grep10004
正常
□是□否
5.查看双机是否运行正常
HP机型su-
cmviewcl-v
SUN机型su–
Hastat|more
IBM机型su-
/usr/sbin/cluster/clstat–a
lssrc-gcluster
lssrc-sappsy
正常
□是□否
6.查看数据库是否运行正常
su–scu
onstat-
正常
□是□否
7.查看文件系统空间是否正常
su–scu
HP机器bdf
SUN机器df–k
IBM机型df
正常
□是□否
8.查看数据库空间是否正常
su–scu
onstat-d
正常
□是□否
9.查看数据库逻辑日志是否正常
su–scu
onstat-l
正常
□是□否
10、检查网卡状况
(IBM)Lsdev-Ccadapter|grepent
(HP)ioscan-fnClan
Lanscan
(SUN)hastat|more
正常
□是□否
11、检查CPU状态
(IBM)lsdev-Ccprocessor
(HP)ioscan-fnCprocessor
(SUN)/usr/platform/sun4u/sbin/prtdiag
正常
□是□否
12、检查内存及其使用状态状态
(IBM)lsdev-Ccmemory
lsattr-Elmem0
Topas
(HP)dmesg
top
(SUN)dmesg
Top
正常
□是□否
功
能
查
询
1.查看PACKAGE倒换是否正常
su–scu
kill_scp.sh或者stop_scu.sh
正常
□是□否
2.查看manager能否把被kill掉的进
程(manager的子进程)重新掉起
su–scu
kill-9PID
正常
□是□否
3.查看数据网卡,heartbeat网卡和备网卡倒换是否正常
su-
lanscan
正常
□是□否
文
件
查
询
1.查看$INFORMIX/online.log是否有异常情况,尤其注意checkpoint的时长
正常
□是□否
2.以scu用户登录主机,观察~scu/sms/record/recbuf下的话单文件中是否正确产生话单、话单格式是否正确、话单大小是否不超过配置文件中配置的大小。
如果采用HDR的方式,则备机上也要求做相同的检查,并且要跟主机上的话单进行对比,看是否一致
正常
□是□否
3.查看$INFORMIX/etc/sqlhosts
/etc/services/etc/hosts
文件是否正确
正常
□是□否
4.查看$INFORMIX/etc/onconfig配置
是否合理
正常
□是□否
5.查看/var/adm/syslog/syslog.log
是否有异常情况
正常
□是□否
6、需要检查的配置文件包括scu用户的.cshrc环境文件、~scu/config下的scusys.cfg、scudual.cfg、scunet.cfg以及~scu/oam下的oamagent.cfg
如果采用HDR的方式,则备机上也要求做相同的检查
正常
□是□否
7.以scu用户登录主机
(1)查看~scu/log下的*.log日志
(2)查看~scu/temp
下的*.run日志,
其中"Mainloopspeed:
58(r/s)"这样的信息表明转速,58为每秒58转。
如果采用HDR的方式,则备机上也要求做相同的检查
正常
□是□否
系
统
查
询
1.CPU占用率
top或者sar6060
CPU的空闲率应该大于40%
正常
□是□否
2.系统查询
su-
dmesg
正常
□是□否
3、操作系统核心参数配置是否正确
(HP)
用sam选择ConfigurableParameters
(SUN:
)
more/etc/system
正常
□是□否
4、SCU数据库各表的结构检查
用scU用户执行命令:
dbschema-dscp的数据库名-ssscu.sql
再检查scu.sql文件basetab_xxx的锁模式、索引等是否正确。
以及所有表的nextextentsize大小是否超过50。
正常
□是□否
5、检查系统的swap分区的大小
当实际内存少于256MB时,交换区的大小应是实际内存大小的两倍。
实际内存为256MB时,交换区的大小一般设为512MB。
实际内存为512MB时,交换区的大小一般设为1GB。
实际内存为1GB时,交换区的大小则应设为1.5GB。
HP:
root用户执行swapinfo-t
SUN:
root用户执行swap–s
IBM:
IBM:
root用户执行lsps-a
正常
□是□否
6、双机时间一致性检查
在tellin主备机上用date命令分别查询主机时间,时间差应小于1分钟。
正常
□是□否
7、异常话单记录检查。
只有采用综合SCU时才需要进行这一步操作。
以scu用户登录主机,使用dbaccess查看abnormalcharge表中的记录
正常
□是□否
8、crontab任务检查。
如果安装了billadm,进行如下检查,否则该项忽略。
(1)以scu用户登录主机,检查~scu/bin/billadm是否存在且scu用户对其有执行权
(2)以root用户登录主机,执行crontab-l,检查crontab列表中是否包含billadm的定时任务,且任务是否正确
如果采用HDR的方式,则备机上也要求做相同的检查。
定时任务正确性可参照下面所列出的内容
03***su-scu-c"/tellin/bin/billadm">/dev/null2>/dev/null
正常
□是□否
9、进程占用CPU情况检查。
(1)以root用户登录主机
(2)执行top命令(如果是IBM机型,则使用topas命令)
(3)记录manager、scf、scfserver、smfagent、oamagent这几个进程占用CPU的情况,建议让命令执行一段时间并取平均值
如果采用HDR的方式,则备机上也要求做相同的检查
正常
□是□否
硬
件
查
询
1.机房温度和湿度是否正常
正常
□是□否
2.电源是否合适
正常
□是□否
3..机柜是否接地线
正常
□是□否
三SDU性能指标测试
备注:
本表适用于HP、IBM、SUN的机型系列,对已经开通的设备会造成不良影响的项目不用测试。
SDU地点:
项目
方法和要求
指标
结果
备注
日
常
操
作
1.查看个进程是否运行正常
su–sdu
p
正常
□是□否
2.MEM板倒换时,OAM能否告警
正常
□是□否
3.双机倒换时,OAM能否告警
正常
□是□否
4.查看SDU和SCU及其SMP之间是否连接正常
netstat-a|grep10002
netstat-a|grep10001
正常
□是□否
5.查看双机是否运行正常
HP机型su-
cmviewcl-v
SUN机型su–
Hastat|more
IBM机型su-
/usr/sbin/cluster/clstat–a
lssrc-gcluster
lssrc-sappsy
正常
□是□否
6.查看数据库是否运行正常
su–scu
onstat-
正常
□是□否
7.查看文件系统空间是否正常
su–scu
HP机器bdf
SUN机器df–k
IBM机型df
正常
□是□否
8.查看数据库空间是否正常
su–scu
onstat-d
正常
□是□否
9.查看数据库逻辑日志是否正常
su–scu
onstat-l
正常
□是□否
10、检查网卡状况
(IBM)Lsdev-Ccadapter|grepent
(HP)ioscan-fnClan
Lanscan
(SUN)hastat|more
正常
□是□否
11、检查CPU状态
(IBM)lsdev-Ccprocessor
(HP)ioscan-fnCprocessor
(SUN)/usr/platform/sun4u/sbin/prtdiag
正常
□是□否
12、检查内存及其使用状态状态
(IBM)lsdev-Ccmemory
lsattr-Elmem0
Topas
(HP)dmesg
top
(SUN)dmesg
Top
正常
□是□否
功
能
查
询
1.查看PACKAGE倒换是否正常
su–sdu
stop_sdu.sh
正常
□是□否
2.查看manager能否把被kill掉的进
程(manager的子进程)重新掉起
su–sdu
kill-9PID
正常
□是□否
3.查看数据网卡,heartbeat网卡和备网卡倒换是否正常
su-
(IBM)Lsdev-Ccadapter|grepent
(HP)ioscan-fnClan
Lanscan
(SUN)hastat|more
正常
□是□否
文
件
查
询
1.查看$INFORMIX/online.log是否有异常情况,尤其注意checkpoint的时长
正常
□是□否
2.查看$INFORMIX/etc/sqlhosts
/etc/services/etc/hosts
文件是否正确
正常
□是□否
3.查看$INFORMIX/etc/onconfig配置
是否合理
正常
□是□否
4.查看/var/adm/syslog/syslog.log
是否有异常情况
正常
□是□否
5、需要检查的配置文件包括sdu用户的.cshrc环境文件、~sdu/config下的sdusys.cfg,以及~sdu/oam下的oamagent.cfg
正常
□是□否
6.以sdu用户登录主机
(1)查看~sdu/log下的*.log日志
(2)查看~sdu/temp
下的*.run日志
正常
□是□否
系
统
查
询
1.CPU占用率
top或者sar6060
CPU的空闲率应该大于40%
正常
□是□否
2.系统查询
su-
(HP&SUN)dmesg
正常
□是□否
3、操作系统核心参数配置是否正确
(HP)
用sam选择ConfigurableParameters
(SUN:
)
more/etc/system
正常
□是□否
4、Sdu数据库各表的结构检查
用sdu用户执行命令:
dbschema-dsdu的数据库名-sssdu.sql
再检查sdu.sql文件basetab_xxx的锁模式、索引等是否正确。
以及所有表的nextextentsize大小是否超过50。
正常
□是□否
5、检查系统的swap分区的大小
当实际内存少于256MB时,交换区的大小应是实际内存大小的两倍。
实际内存为256MB时,交换区的大小一般设为512MB。
实际内存为512MB时,交换区的大小一般设为1GB。
实际内存为1GB时,交换区的大小则应设为1.5GB。
HP:
root用户执行swapinfo-t
SUN:
root用户执行swap–s
IBM:
IBM:
root用户执行lsps-a
正常
□是□否
6、双机时间一致性检查
在sdu主备机上用date命令分别查询主机时间,时间差应小于1分钟。
正常
□是□否
7、以sdu用户登录主机,使用dbaccess查看abnormalcharge表中的记录
正常
□是□否
8、进程占用CPU情况检查。
(1)以root用户登录主机
(2)执行top命令(如果是IBM机型,则使用topas命令)
(3)记录manager、sdf、sdfserver、smfagent、oamagent这几个进程占用CPU的情况,建议让top命令执行一段时间并取平均值。
除了要记录SDU应用所对应的进程外,还要特别关注有没有其它进程占用CPU过多,一般超过8%就需要特别注意
正常
□是□否
硬
件
查
询
1.机房温度和湿度是否正常
正常
□是□否
2.电源是否合适
正常
□是□否
3..机柜是否接地线
正常
□是□否
四OAM性能指标检测
机型:
HP、SUN、IBM
组网方式:
共享磁盘
子系统:
OAMS
项目
方法和要求
指标
结果
备注
进程检查
进程检查
1、以oams用户登录主机
2、执行命令procs.sh
正常
□是□否
日志检查
1、以oams用户登录主机
2、检查~/oams_run/log下的日志文件:
3、在windows下进入oamclient,查看界面下方的“告警信息”--“级别”
日志中没有ERROR字样,日志文件增长不应很快,日志文件不应过大
正常
□是□否
进程占用内存情况检查
1、以root用户登录主机
2、执行操作系统相应的命令
HP:
top
SUN:
top
IBM:
topas
3、记录应用进程占用的内存(top命令的SIZE域,topas命令的倒数第二列)
应用进程占用内存情况正常,没有过大占用内存的异常进程
正常
□是□否
进程占用CPU情况检查
1、以root用户登录主机
2、执行操作系统相应的命令
HP:
top
SUN:
top
IBM:
topas
3、记录应用进程占用CPU的情况
正常
□是□否
配置文件检查
1、以oams用户登录主机
2、环境变量
~/oams_run/shell/env.rc
3、路由配置
~/oams_run/cfg/route.cfg
4、屏蔽配置
~/oams_run/cfg/screen.cfg
正常
□是□否
连接端口检查
1、以oams用户登录主机
2、记录~/oams_run/cfg/route.cfg中子节点的CI和CP配置:
例如,
CI=IP1|...|IPn
CP=PORT1|...|PORTn
3、查看与oam子节点的网络连接状态
命令:
netstat-na|grepPORTn|grepIpn
4、查看与oamclient的通讯端口状态
命令:
netstat-na|grepport
(port为~/oams_run/shell/env.rc中OAMEXTERNAL的值)
正常
□是□否
五SMAP性能指标测试
备注:
本表适用于PC机,对已经开通的设备会造成不良影响的项目不用测试。
SMAP地点:
项目
方法和要求
指标
结果
备注
日
常
操
作
1.检查是否有计算机病毒
正常
□