中间件运维服务Word文件下载.docx
《中间件运维服务Word文件下载.docx》由会员分享,可在线阅读,更多相关《中间件运维服务Word文件下载.docx(5页珍藏版)》请在冰豆网上搜索。
结合用户现有的环境、组织结构、IT资源和管理流程的特点,从流程、人员和技术三方面来规划用户的网络信息系统的结构。
将用户的运行目标、业务需求与IT服务的相协调一致。
行天科技提供的信息系统服务的目标是,对用户现有的信息系统基础资源进行监控和管理,及时掌握网络信息系统资源现状和配置信息,反映信息系统资源的可用性情况和健康状况,创建一个可知可控的IT环境,从而保证用户信息系统的各类业务应用系统的可靠、高效、持续、安全运行。
服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:
Ø
运行状态、故障情况
配置信息
可用性情况及健康状况性能指标
1.2
中间件管理是指对BEAWeblogic、MQ等中间件的日常维护管理和监控工作,提高对中间件平台事件的分析解决能力,确保中间件平台持续稳定运行。
中间件监控指标包括配置信息管理、故障监控、性能监控。
n
执行线程:
监控WebLogic配置执行线程的空闲数量。
JVM内存:
JVM内存曲线正常,能够及时的进行内存空间回收。
JDBC连接池:
连接池的初始容量和最大容量应该设置为相等,并且至少等于执行线程的数量,以避免在运行过程中创建数据库连接所带来的性能消耗。
检查WEBLOG日志文件是否有异常报错。
如果有WEBLOG集群配置,需要检查集群的配置是否正常。
2
2、MQ中间件维护项目
1.实时监控以下文件系统使用情况:
检查文件系统/var/mqm
MQ应用所在文件系统。
2.定期报告MQ系统错误,备份清理MQ系统错误记录
在遇到问题时,检查/var/mqm/errors目录下是否有新的FDC文件产生,如果有应当立即报告IBM技术支持部门。
另外,要定期检查该目录下MQ错误日志。
3.监控队列深度
DISQLOCAL(QName)
该命令的显示结果可以看出队列当前深度
4.检查死信队列
DISQLOCAL(DEADQName)
5.检查日志个数是否增长
使用命令cd移动到MQ日志所在目录,使用ls–l|wc命令统计,如果有所增长,应立即报告IBM系统支持人员。
6.检查MQ队列管理器错误日志
当系统运行不正常时首先检查:
/var/mqm/qmgrs/<
QMName>
/errors/AMQERR0n.LOG
7.检查、处理队列管理器pending事务
若队列管理器启动成功后,CICS(配置XAD连接MQ)启动失败,则可以检查是否有pending事务,若有必须进行处理(可能造成数据的不一致性,必须事先加以确认)。
Websphere维护项目
系统安装规范和流程。
全新系统从操作系统、数据库、WebSphere相关组件,按照特定was/ihs版本根据安装手册设立安装规范和流程(目前已经完成此项文档)。
系统维护规范和流程。
比如大版本升级\小版本\APAR\fix维护。
是否应用某些关键fix的判断原则,是建议打?
是可选?
对于可选,分析具体fix用途以及对应用影响,并和开发部配合沟通的流程。
应用部署规范。
包括初始应用部署和大版本升级。
重新部署和测试
应用修改流程。
Jsp,修改程序时间后让其自动更新。
Class,servlet,ejb,一般重启应用服务器,对于公共模块,重启was等。
常用工具说明文档和使用流程。
脚本开发和使用,wsadmin脚本,管理控制台,PMI(连接池释放等)等工具。
后面又详细描述。
应用的发布位置要求规范。
系统安装路径规范,应用发布路径,repository位置规范,log,property文件规范等等。
(不当的位置可能带来严重后果,比如/home/,批量修改的后果)
Websphere系统优化
JVM基本调优
Web容器接收请求线程池。
Web容器Servlet引擎线程池的值在合理的范围内
JDBC数据库连接池
数据库连接池的最大值要稍小于Web容器线程池的大小
后台数据库本身能接受的客户端连接数目
合理设置数据源配置项中的preparedstatement缓存的大小,提高后台数据库访问的效率。
3、对Websphere进行监控管理和问题诊断
对Websphere的资源和可用性进行管理
管理员需要对WebSphere的资源信息,JVM的CPU、内存、jdbc连接池、线程池、EJB调用情况、GC的情况、Session的连接情况等做实时的信息监控,并且将这些数据收集起来,作为长期性能趋势
对WebSphere用户请求信息的监控
对用户的请求信息进行实时监控,对关键的请求信息以及持续占用系统资源比较高的请求进行告警处理。
过历史信息收集和分析,分析哪些请求在哪些时间段是频繁的,哪些业务是用户最多关心和访问的,帮助优化业务过程,提高服务质量。
对应用问题的深度诊断和分析
在实际的应用开发中,由于对J2EE组件使用不当,或者是代码编写的不规范,可能会出现一些很难发现且难以解决的问题,比如线程死锁、内存泄漏、内存溢出等。
Weblogic维护
中间件故障诊断总结
一、步骤:
1、准确描述现象:
客户说的和自己查看到的:
平台、版本、操作、信息等。
特别是,故障前是否有做过什么操作:
网络调整、设备调整、主机参数调整、配置文件修改„„反正将这一切都列入排查的对象。
2、使用工具收集数据,收集配置文件、日志、dump文件等等。
3、使用分析数据,根据问题或收集的数据,使用适当的工具分析数据,当然包括了在网上和在官方支持站点搜索类似的问题的解决办法。
4、尝试解决问题,根据找到的问题点,尝试解决。
如修改错的,复原正确的;
运行有问题的,适当调整运行的环境和运行的参数等等。
5、给出最佳解决方案,一般就是继续观察了。
6、总结经验并加以重用,知识积累。
小魏16:
50:
21
[文件:
Tuxedo维护文档.pdf]
Tuxedo维护
4.性能调优
关闭不使用的特性
Tuxedo7.1加入了多线程、Contexts、安全、第三方安全插件的特性,这些特性在7.1版本中总是“Available”的,但在8.0中可以把它们“turnoff”OPTOINSNO_AA,NO_XA(NO_AA关闭安全插件特性,AUTHSVR可继续使用)
设置环境变量TMNOTHREADS=Y,旁路C和S的多线程特性
使用服务和接口Cache
TUXEDO8.0及以后的版本都支持服务和接口的缓存,这样客户机可以直接请求高速缓存中的服务或接口的副本,而不必到公告板中去查找。
这一特征会显著地改善服务器的性能,尤其是当系统有大量的用户,而只有少量的服务的情况。
在*RESOURCES或*MACHINES段中设置Cache的入口数:
SICACHEENTRIESMAX=N,缺省为500,0表示不使用Cache,最大值为32767
配置MSSQ服务器组提高性能
配置方法
simpservSRVGRP=GROUP1SRVID=10MIN=3MAX=5RQADDR=simpservREPLYQ=YMSSQ的使用原则:
§
服务器在2—10个之间,如果超过10个,建议配置多个MSSQ§
服务被频繁调用,处理时间又很短§
请求缓冲区不都不是很大,没有大到将一个队列占满的情况
§
如果MSSQ的请求队列占用率超过85%,建议剥离一部分SVR
通过配置负载均衡提高性能
步骤:
在UBB文件设置:
LDBAL=Y
§
在客户端使用tpcall()测试每个SVC的处理时间,记为Ti
§
求出所有SVC执行时间的平均值,记录为T
§
为每个SVC设置LOAD因子,如果Ti≈T,则LOAD设置为50,如果Ti>
T,则设置LOAD为大于50的值,否则设置LOAD为小于50的值通过配置优先级参数提高性能
方法:
管理方法:
为单个服务指定PRIO因子
§
编程方法:
在代码中使用tpsprio()动态设置优先级
原则:
由于高优先级的接口请求先出队,因此只能给一些不经常被调用的接口或服务设置高优先级。
在你把一个服务或接口的优先级调低之前,你应确保这个服务或接口的响应时间并不重要才行。
通过服务绑定提高性能
原则
§
把业务功能相似的SERVICES绑定到一个SERVER中。
§
把调用了相同链接库或其它资源的SERVICES绑定到一个SERVER中,减小应用程序的大小,节省磁盘空间
§
执行时间和优先级相近的SERVICE可放到同一个SERVER中
§
把调用频率相同的SERVICES绑定在同一个SERVER中
§
同一个SERVER中的SERVICE最好有相同的服务优先级,如果不同,优先级最低的那个的
请求可能要很长时间才得到处理。
不要相互调用的SERVICES放在同一个SERVER中,这有可能导致服务器死锁§
把经常用的SRV绑定在一起,不经常用的绑定在一起
§
把使用相同RM的SRV绑定在一起
§
把执行QUERY的SRV绑定在一起,执行UPDATE的绑定在一起§
对一些使用率较高的服务,如银行的取款服务WITHDRAWAL,应该单独把它放到一个SERVER中,并采用MSSQ方式
§
把处理某一类业务的SRV绑定在一起
考虑因素
§
要考虑队列的容量,请求队列使用率超过85%时,Tuxedo把请求写到磁盘文件中,然后再传给服务器处理,这时性能大大下降通过系统参数配置提高效率MAXACCESSERS,MAXSERVERS,MAXINTERFACES,MAXSERVICESMAXWSCLIENTS这参数增加了信号量和共享内存的开销
MAXWSCLIENTS
§
与所购买的LICNESE数有关,可设置得比所购买的LICENSE数大一些。
当并发连接数大于所购买的LICENSE数时,TUXEDO会报警,(在ULOG中回有信息)当超过10%时,TUXEDO拒绝新的CLIENT端连入,客户端的tpinit()会报错
MAXGTT,MAXBUFTYPE,MAXBUFSTYPESANITYSCAN,BLOCKTIME
§
如果没有全局事务,可把MAXGTT设置为0。
如果系统运行在慢处理器(可能由于负载过重造成),你可以适当增大SANITYSCAN,BLOCKTIME和单个事务超时等时间参数。
BBLQUERY和DBBLWAIT
如果网络缓慢,你可以适当增加BLOCKTIME,BBLQUERY和DBBLWAIT参数值