接入网宝典第38期网管系统日常维护指导.docx
《接入网宝典第38期网管系统日常维护指导.docx》由会员分享,可在线阅读,更多相关《接入网宝典第38期网管系统日常维护指导.docx(15页珍藏版)》请在冰豆网上搜索。
接入网宝典第38期网管系统日常维护指导
前言:
本着“共同学习,共同提高”的宗旨,我们汇总整理了华为接入网设备日常维护中需要特别注意的事项和常见问题解答,发布在华为技术支持网站首页“华为资源-电子期刊-接入网宝典”栏目,希望对您的日常设备维护工作有所帮助。
让我们携起手来,共同打造可运营、可管理的精品网络!
接入网宝典
―网管系统日常维护指导
尊敬的客户:
iManagerN2000固定网综合网管系统(以下简称N2000)是管理华为固定网络设备的网管产品实现了对多种设备的管理功能。
本文将介绍网管系统的日常维护工作。
iManagerN2000固定网综合网管系统在设计中充分考虑了各种安全措施,以确保系统的稳定运行,但在不同的运行环境中,要保证系统可靠持久地运行,还要取决于有效的日常维护。
“防患于未然”,及时发现问题并妥善解决问题就是例行维护的目的。
本部分对例行维护中需要做什么、如何做等做了简单的指导,同时也为您确定本局维护方案提供了基本方法和参考依据。
按周期长短对例行维护进行了分类描述,基本内容如下:
∙例行维护建议
∙每日例行维护
∙每周例行维护
∙每月例行维护
建议在维护过程中及时记录维护结果,为日后检查设备运行状况、调查故障原因提供依据。
一、例行维护建议
在进行例行维护时,请遵循以下的原则和建议:
1、设备要清洁干净,防尘防潮。
2、请勿在安装网管系统的计算机上玩游戏,装入其它不必要的软件,或将计算机挪为他用。
3、每天须参照日常维护操作指导中相关内容,进行常规检查和测试,并做好记录。
4、发现问题及时处理,处理不了的问题请及时向华为公司驻当地办事处联系解决。
5、请勿对设备复位、加载或轻易改动数据;如果改动数据,改动前要做数据备份同时做好修改记录,改动后一周内确认机器运行无误,方可删除备份数据。
6、请勿使用网管系统提供的工具软件以外的其它软件直接对数据库进行操作,以免导致严重后果。
7、各种帐号及口令,要按级别分配权限,严格管理,定期更改,并只向维护责任人发放,管理级口令只有维护负责人掌握,做到权责分明。
二、每日例行维护
监视与处理告警
维护目的
该项目是日常维护中一项很重要的内容,通过查看设备上报的告警详细信息,进行故障的分析定位,及时排除故障。
参考指标
无。
维护指导
日常中需要实时监视告警上报,在客户端主窗口工具条的右侧,实时显示了告警板缩略图,方便监视当前告警信息,如图1-1。
若告警板缩略图中指示灯闪烁,表示有告警上报。
图1-1
告警板中指示灯闪烁,表示有告警上报,如图1-2:
图1-2
对于设备上报上来的紧急告警,如单板故障,需要及时进行处理。
查看进程运行状态
维护目的
检查网管服务器所有进程的运行状态,及早发现并排除运行状态“异常”的进程,以保证系统所有服务的正常实现。
参考指标
网管服务进程都处于运行状态。
维护指导
打开N2000Sysmonitor,可以看到所有的进程状态。
通过查看进程操作,检查系统进程的当前运行状态和重启次数,如果进程当前状态为“停止”,可通过手工启动该进程。
手工启动已经停止进程方法:
右键点击进程状态,选择启动进程即可,完成后,进程状态将显示为运行,如图1-3。
图1-3
查看进程重启次数,需要首先选择某个进程,然后手工输入Ctrl+Alt+r(同时按下Ctrl、Alt和r键),这时在最后一列可以显示该进程的重启次数,如图1-4。
期望的结果是重启数为0,如果不为0,说明有异常,请联系华为公司当地办事处工程师。
图1-4
查看服务器性能
维护目的
查看CPU占用率和已用内存大小,了解网管服务器当前运行状况,及早发现并解决异常,保障系统高效运行。
参考指标
服务器CPU占用率低于85%,已用内存应低于总内存大小的95%。
维护指导
通过查看系统资源操作获取CPU占用率和已用内存大小。
进入sysmonitor后,选择系统资源信息页签,可以看到相关信息,如图1-5:
图1-5
如果发现CPU的占用率及内存的占用率已经达到了85%以上,或者内存使用达到了95%,可以查看哪些进程没有使用,对于没有使用的进程,可以手工停止。
如果停掉所有没有用的进程后,CPU及内存的占用率仍然无法达到参考指标以下。
此时,需要联系华为公司当地办事处工程师进行相应的处理。
查看设备与网管通信状态
维护目的
查看设备与网管的当前通信状态,及时发现并排除异常。
参考指标
设备节点图标或单板显示颜色非灰色时,均表示通信正常。
或直接刷新设备节点或面板时,系统显示刷新成功的提示信息也表示当前通信正常。
维护指导
浏览拓扑节点或单板颜色,并依据各种状态的指示颜色,或根据刷新操作的提示信息,判断设备的当前状态。
期望的结果是所有网元状态为绿色,如果出现图1-6显示的情况,说明有异常产生,需要排除故障。
图1-6
如果设备显示灰色,表明设备处于脱管状态,可以右键点击设备,选择工具,然后进行ping测试,如果不能ping通,需要检查网络,很可能是由于物理链路出现了异常。
如果能够ping通,刷新设备状态,如果仍旧无法变绿,请联系华为公司当地办事处工程师。
如果设备显示为红色,表明设备上有故障产生,请立即联系机房维护人员对设备进行检查。
查看用户操作
维护目的
通过查看操作日志记录或检查用户操作,了解用户登录网管所进行的操作,以便及时发现异常,防范非法用户的恶意操作;另外还可以作为网管维护人员误操作的回溯根据。
参考指标
操作日志记录中无异常和当前用户无恶意操作。
维护指导
通过浏览用户日志操作查看登录用户所进行的操作。
通过实时监视操作日志操作查看当前登录系统的用户正在进行的操作。
1.查看用户日志,首先选择系统/浏览用户日志,如图1-7
图1-7
然后可以看到用户做了哪些操作及其操作结果,也可以手工设置范围,查找需要关注的日志信息,如图1-8:
图1-8
2.通过实时监视操作日志操作,可以查看当前登录系统的用户正在进行的操作。
选择系统/监视用户操作,也可以通过手工选择进行过滤,对关注的部分进行监视,如图1-9:
图1-9
三、每周例行维护
转储操作日志
维护目的
将用户操作日志数据查询出来进行备份,以便日后查阅,必要时打印成纸件。
参考指标
无。
维护指导
通过转储用户日志操作实现操作日志的转储。
选择[系统/浏览用户日志]菜单项,进入“浏览用户日志”窗口,如图1-10;
图1-10
点击确定后,开始转储,之后会出现日志转储成功提示框,如图1-11:
图1-11
然后在服务器/opt/n2000/server/dump下可以找到此转储日志。
管理服务器硬盘空间
维护目的
检查服务器硬盘空间上各分区的当前使用状况,以免剩余空间过少,影响系统性能。
参考指标
建议各分区的使用率应低于80%。
维护指导
通过查看硬盘操作获取各分区的使用状况。
若使用率高于80%,应尽快整理硬盘,清除垃圾文件。
启动系统监控终端;
单击“硬盘信息”页签,以列表形式显示网管服务器所在计算机的硬盘信息,如:
服务器名、操作系统、硬盘分区、总空间、已用空间、剩余空间和使用比率,如图1-12。
图1-12
管理数据库空间
维护目的
查看系统自动转储和自动备份状况,确保数据库系统的数据和日志存储空间有足够剩余,以保证网管系统的正常运行。
参考指标
对于数据库的剩余空间范围难以有个定值,根据系统实际运行需要而定,若数据增长较快就应多预留一些。
建议数据库剩余空间至少不要低于数据库总空间的20%。
维护指导
启动系统监控终端;单击“数据库信息”页签,可以看到如图1-13的信息:
图1-13
如环境监控EnpowerDB数据库满,可以从界面上将数据备份出来(方法见下一节,备份数据库),然后可用通过SQL脚本将EnpowerDB中历史日志清除以达到扩充日志空间目的。
在SQL 的 query analzer执行以下脚本即可:
use EnpowerDB
go
truncate table tbl_EnpHistoryDataTab
go
print 'OK'
go
备份数据库
维护目的
对数据库进行备份,以保障数据库出现意外时能得以恢复。
参考指标
无。
维护指导
对数据库备份可以通过数据库备份工具完成,可以通过手工立即进行备份;也可通过系统提供的自动备份功能进行备份。
1.手工备份.首先配置需要备份的数据库集合,如图1-14:
图1-14
然后在左侧选择手工备份,选择配置好的数据库集合,点击下一步,再点击完成,就可以开始进行数据库备份了,备份的路径为/opt/n2000/backup,如图1-15:
图1-15
2.自动备份.与手工备份相比,这种备份方式除了要配置数据库集合外,还应配置备份策略,可以根据实际情况选择备份策略,如图1—16:
图1-16
然后选择定时备份任务,选择数据库集合,选择定时备份策略,再选择备份设备,点击完成,就可以创建一个定时备份的任务了(如图1-17)。
这时,数据库可以进行定时自动备份。
图1-17
四、每月例行维护
管理用户帐号
维护目的
清理网管用户帐号以及用户口令,以保证网管系统的安全性。
参考指标
建议每月修改一次超级用户口令。
维护指导
定期审核所分配用户帐号的操作和管理权限是否符合分配标准,修改用户口令,删除过期帐号等。
例如修改密码,可以选择系统/安全管理,右键点击用户名,可以对这个用户设置密码,如图1-18:
图1-18
然后会出现一提示框,提示输入旧密码和新密码,如图1-19:
图1-19
输入完成后,点击确定后,新密码生效。
检查机房环境
维护目的
检查网管系统硬件的运行环境,以保障正常、稳定运行。
参考指标
温度(正常15~30℃)、湿度(正常40%~65%)和防尘状况(好、差)。
维护指导
分别检查网管机房的温度、湿度和防尘状况。
检查服务器电源
维护目的
为了保证网管系统的稳定运行,要求服务器必须配备UPS电源,配置网管备用电源,而且电源插座无松动。
参考指标
无。
维护指导
检查服务器是否已配置UPS电源,是否配置网管备用电源。
电源线是否老化,网管备用电源是否插上,连接点有无腐蚀,电源插座是否松动,开关是否正常。
电压、电流显示是否正常等。
检查系统硬件
维护目的
检查系统硬件的运行状况、及时发现并排除隐患,保证系统运行在一个安全环境中,以降低设备的故障率,延长设备的使用寿命。
参考指标
无。
维护指导
计算机及其附属设备检查键盘、鼠标、显示器、软驱、网络能否正常工作。
此致
敬礼!
华为技术有限公司全球技术服务部
意见反馈:
如有任何意见和建议,请发送supportmaster@。
【接入网宝典】维护宣传系列在陆续发布上网的同时,也通过email邮件发送部分客户维护工程师。
如果您希望收到相关邮件,请发邮件给supportmaster@。
******************************************************************************************
华为机密,未经许可不得扩散