dataware双机软件维护手册.docx
《dataware双机软件维护手册.docx》由会员分享,可在线阅读,更多相关《dataware双机软件维护手册.docx(50页珍藏版)》请在冰豆网上搜索。
dataware双机软件维护手册
DataWare双机容错软件维护手册
1.DataWare双机容错的基本架构
双机容错的目的在于确保数据数据的安全性以及系统永不停机(Non-stop),采用豪威所自行研发的DataWare软件能够轻易的达成系统永不停机的状况,若能够搭配本公司的智能型磁盘阵列系统,更能够有效的将数据数据的安全性提升至最高。
一般来说,DataWare双机容错软件的机本架构共分成两种模式:
1.双机互备援(DualActive)、2.双机热备份(HotStandby)。
1.1双机互备援(DualActive)基本简介
所谓双机互备援意指两台服务器均为工作服务器,在正常情况下,两台工作服务器均为信息系统提供支持,并相互监视对方的运作状况。
当一台服务器出现异常造成不能支持信息系统正常运作时,另一服务器则会主动接管(TakeOver)异常服务器的工作,继续支持信息的运作,从而确保信息系统能够不间断地运行,而达到不停机的功能(Non-Stop),但正常运行服务器的负载(Loading)会有所增加。
此时必须尽快将异常机修复以缩短正常机负载持续时间,当异常服务器经过维修恢复正常后,系统管理员通过管理命令,可以将正常服务器所接管的工作切换回已被修复的异常服务器
1.2双机互备援(DualActive)切换时机
-系统软件或应用软件造成服务器当机。
-服务器未当机,但系统软件或应用软件工作不正常。
-服务器内SCSI卡损坏,造成服务器与磁盘阵列无法存取数据。
-服务器内硬件损坏,造成服务器当机。
-服务器不正常关机。
1.3双机热备份(HotStandby)基本简介
所谓双机热备份就是一台服务器为工作服务器(PrimaryServer),另一台服务器为备援服务器(StandbyServer),在系统正常情况下,工作服务器为信息系统提供支持,备援服务器监视工作服务器的运行情况(工作服务器也同时监视备援服务器是否正常,有时备援服务器因某种原因出现异常,工作服务器可尽早通知系统管理工作人员解决,确保下一次切换的可靠性)。
当工作服务器出现异常而无法支持信息系统运营时,备援服务器将会主动接管(TakeOver)工作服务器的工作,继续支持信息的运作,从而保证信息系统能够不间断地运行(Non-Stop)。
当工作服务器经过维修恢复正常后,系统管理人员通过管理命令或经由以人工或自动的方式将备援服务器的工作切换回工作服务器;也可以启动监视程序,监视备援服务器的运行情况,此时,原来的备援服务器就成了工作服务器,而原来的工作服务器就成了备援服务器。
1.4双机热备份(HotStandby)切换时机
-系统软件或应用软件造成服务器当机。
-服务器未当机,但系统软件或应用软件工作不正常。
-服务器内SCSI卡损坏,造成服务器与磁盘阵列)无法存取数据。
-服务器内硬件损坏,造成服务器当机。
-服务器不正常关机。
2.DataWare双机容错工作原理
2.1服务进程
2.1.1网络服务
双服务器端对于用户一端,由监控软件DataWare提供一个逻辑的IP地址,
如:
170.200.80.99,任何一位使用者上网只需要用到这一地址;当后端有一台服务器出现故障时,另外一台服务器会自动将其网卡的IPAddress替换为170.200.80.99;这样,使用者端的网络不会因为一台服务器出现故障而造成服务中断。
2.1.2数据库服务
当有一台服务器出现故障时,另外一台服务器会自动接管数据库引擎;同时启动数据库和应用程序,让使用者对数据库可以继续操作,不至于对使用者产生不方便。
2.2监控原理
2.2.1透过串行端口(RS232)侦测
使用者可透过最简易的串行端口(RS232)连接来进行DataWare双机容错
系统之侦测
2.2.2透过SCSIDevice侦测
对于某一台服务器而言,将侦测讯息以类似于记录方式写在该小区内,其中每一笔记录包括如下内容:
●系统对本机的监测状态信息。
●对等服务器是否看到本机状态的信息。
当一台服务器有问题或出现故障时,对等服务器会在最短时间内发现记录内容没有更新,即会调用网络心跳侦测再次确认系统状态。
当两组心跳都判断系统故障时,DataWare将故障服务器的交易业务在最小安全切换时间内切换到对等服务器继续运行,同时修改记录区内容,而切换时间的长短,则在于应用程序的复杂程度而定。
2.2.3透过网络侦测
服务器透过网络设备侦测两台服务器服务器的工作状态。
当有一台服务器因为网络故障或其它原因引起故障而不能正常服务时,对等服务器的可调
变心跳频率不断提高;在最小心跳时间内发现心跳记录内容没有更新,即会调用SCSI心跳侦测再次确认系统状态;当两组心跳都判断系统故障时,DataWare双机容错软件将故障服务器的交易业务在最小安全切换时间内切
换到对等服务器继续运行,同时修改记录区内容。
3.DataWare画面功能介绍
DataWare主程序包含了「系统状态」、「服务器」、「私用网络」、「资源物件」、「事件纪录」、「系统设定」「联机说明」这几个标签,以下针对这些标签做细部的说明。
3.1指示器图示内容说明
指示器位于DataWare主程序画面右上方,其功能可让使用者透过图标的变
化进而能够了解系统目前的状况。
指示器图示全图:
细部内容介绍:
•
注册码:
若软件尚未注册,则呈闪烁红色图示显示。
若已注册,则以
蓝底白色图示显示。
•
系统核心服务:
若DataWare服务尚未启动则呈闪烁红色图示显示。
若已经启动,则以蓝底白色图示显示。
•
私用网络:
若私用网络联机尚未联机或至少有任何一个联机失败或断
线,则呈闪烁红色图示显示。
若私用网络联机正常,则
以蓝底白色图示显示。
•
资源接管:
若系统发生TakeOver或FailureOver时,则呈闪烁红色图
示显示。
若未发生TakeOver或FailureOver,则以蓝底白色图示显示。
3.2计算机状态图标内容说明
•
Offline模式:
系统尚未启动。
•
Fail模式:
系统尚未开机或DataWare双机容错软件尚未启动。
•
Startup模式:
DataWare双机容错软件启动中。
•
Standby模式:
系统处于备援待命状态。
•
Active模式:
系统处于拖管资源状态
3.3系统状态内容说明
系统状态卷标底下可以观看整个包含服务器、私用网络、资源物件以及事
件纪录的大略状态,右方的图示亦可清楚的了解两台主机与磁盘阵列机之
间的联机状态。
此外,若需要各部分的详尽内容,请点选各部分详情以更
进一步了解。
3.4服务器内容说明
服务器标签底下可观看本地及对等主机名称、状态以及网络适配卡各项信
息。
•
3.4.1文字内容说明:
主机名称:
显示主机之名称
主机状态:
观察主机是否启动、状态是否在作用中或者是备援角色。
NIC:
网络卡详细信息。
3.4.2按钮内容说明:
停止双机容错系统:
将DataWare服务启动。
启动双机容错系统:
将DataWare服务中止。
读取对等主机NIC:
撷取对等主机网络适配卡状态,并呈现在对等主机NIC栏位。
存储设定:
存储DataWare系统内部设定值。
复原设定:
还原DataWare系统内部设定值。
3.5私用网络内容说明
在私用网络卷标底下可观看以及操作三种不同的私用网络联机状态,分别
为「网络型」私用网络、「串行端口」私用网络以及「共用磁盘」私用网
络。
3.5.1网络型
以网络型态作为侦测本地端/对等端主机的联机状态。
•文字内容说明:
现在状态:
目前是否处于联机状态。
本地端/对等端埠号:
连接埠号,可自行定义,默认值为5000。
本地端/对等端IP地址:
可选择本地端/对等端主机作为网络型态侦测联机的IP地址。
心跳间隔(秒):
可设定本地端/对等端主机相互侦测的周期,以秒为单位。
可承受的连续心跳丢失次数:
可设定容许本地端/对等端主机心跳连续失联次数,若在规定次数内无反应,则系统将会显示联机失败。
启动双机容错系统时,自动开启:
若打勾则双机启动时会自动将此型态联机自动开启,反之则否。
•按钮内容说明:
变更:
将变更过的参数做更新。
开启:
启动私用网络作为联机。
复位:
将参数恢复初始值。
3.5.2串行端口:
以串行端口作为侦测本地端/远程主机的联机。
•文字内容说明:
现在状态:
可观察目前是否处于联机状态。
本地端串行端口:
本地端串行端口端口号,默认值为COM1。
每秒位数:
默认值为9600。
心跳间隔(秒):
可设定本地端/对等端主机相互侦测的周期,以秒为单位。
可承受的连续心跳丢失次数:
可设定容许本地端/对等端主机心跳连续失联次数,若在规定次数内无反应,则系统将会显示联机失败。
启动双机容错系统时,自动开启:
若打勾则双机启动时会自动将此型态联机自动开启,反之则否。
•按钮内容说明:
变更:
将变更过的参数做更新。
开启:
启动私用网络作为联机。
复位:
将参数恢复初始值
3.5.3共用磁盘:
以共享磁盘作为侦测本地端/远程主机的联机。
•文字内容说明:
现在状态:
可观察目前是否处于联机状态。
本地端/对等端磁盘:
设定本地端/对等端磁盘代号。
心跳间隔(秒):
可设定本地端/对等端主机相互侦测的周期,以秒为单位。
可承受的连续心跳丢失次数:
可设定容许本地端/对等端主机心跳连续失联次数,若在规定次数内无反应,则系统将会显示联机失败。
启动双机容错系统时,自动开启:
若打勾则双机启动时会自动将此型态联机自动开启,反之则否。
•按钮内容说明:
更新:
将变更过的参数做更新。
开启:
启动私用网络作为联机。
复位:
将参数恢复初始值。
3.6资源物件内容说明
透过资源物件卷标,使用者可以很清楚的知道双机容错系统所拥有的资源
物件,并可以观察到哪一台主机正在执行哪些资源物件的运作,若需要手
动切换彼此的资源物件,在此亦可轻松的操作。
文字内容说明:
树状显示:
将所有资源物件以树状方式显示。
表列显示:
将所有资源物件以列表方式显示。
增加资源物件:
提供使用者选择新增的资源物件,计有IP地址、共享目录、系统服务、主机别名、磁盘、自定义资源。
将所有资源物件切换到本地端主机:
将所有资源物件切换到本地端主机。
将所有资源物件切换到对等主机:
将所有资源物件切换到对等端主机。
•按钮内容说明:
增加:
新增资源物件类别。
3.6.1个别资源物件介绍
3.6.1.1IP地址资源:
•文字内容说明:
资源物件名称:
新增IP地址资源物件名称,以供辨识之用。
主要服务器:
选择所要管理此资源物件的主要服务器。
备援服务器:
显示管理此资源物件的备援服务器。
释放资源失败时可跳过:
当资源物件发生异常而释放资源物件做切换时,可选择是否忽略资源释放失败的错误。
自动切换回车:
决定是否自动切换回原本托管之主机(AutoSwitchBack)。
定期监测周期:
设定资源物件的监测周期,以毫秒(MS)为单位。
监测作业重试次数:
设定资源物件的监测重试次数,此次为单位。
资源启动逾时设定:
设定此资源物件之启动逾时时间,以毫秒(MS)为单位。
资源停止逾时设定:
设定此资源物件之停止逾时时间,以毫秒(MS)为单位。
本地主机NIC:
设定本地端主机原始的IP地址和原始的子网络遮罩。
对等端主机NIC:
设定对等端主机原始的IP地址和原始的子网络遮罩。
主要IP地址:
设定此资源物件的IP地址。
主要子网络遮罩:
设定此资源物件的子网络遮罩。
•按钮内容说明:
增加:
新增此资源物件。
复位:
将此资源物件数值恢复初始值。
3.6.1.2共享目录资源:
•文字内容说明:
资源物件名称:
新增共享目录资源名称,以供辨识之用。
主要服务器:
选择所要管理此资源物件的主要服务器。
备援服务器:
显示管理此资源物件的备援服务器。
释放资源失败时可跳过:
当资源物件发生异常而释放资源物件做切换时,可选择是否忽略资源释放失败的错误。
自动切换回车:
决定是否自动切换回原本托管之主机(AutoSwitchBack)。
定期监测周期:
设定资源物件的监测周期,以毫秒(MS)为单位。
监测作业重试次数:
设定资源物件的监测重试次数,此次为单位。
资源启动逾时设定:
设定此资源物件之启动逾时时间,以毫秒(MS)为单位。
资源停止逾时设定:
设定此资源物件之停止逾时时间,以毫秒(MS)为单位。
依存子资源:
选择此资源物件所依存的子资源物件名称。
可选择的依存子资源:
可供选择的依存子资源清单。
共享目录资源:
选择您想要共享的资源目录。
•按钮内容说明:
增加:
新增此资源物件。
复位:
将此资源物件数值恢复初始值。
3.6.1.3系统服务资源:
•文字内容说明:
资源物件名称:
新增系统服务资源名称,以供辨识之用。
主要服务器:
选择所要管理此资源物件的主要服务器。
备援服务器:
显示管理此资源物件的备援服务器。
释放资源失败时可跳过:
当资源物件发生异常而释放资源物件做切换时,可选择是否忽略资源释放失败的错误。
自动切换回车:
决定是否自动切换回原本托管之主机(AutoSwitchBack)。
定期监测周期:
设定资源物件的为单位。
监测作业重试次数:
设定资源物件的监测重试次数,此次为单位。
资源启动逾时设定:
设定此资源物件之启动逾时时间,以毫秒(MS)为单位。
资源停止逾时设定:
设定此资源物件之停止逾时时间,以毫秒(MS)为单位。
依存子资源:
选择此资源物件所依存的子资源物件名称。
可选择的依存子资源:
可供选择的依存子资源清单。
系统服务资源:
选择您想要托管的系统服务资源。
•按钮内容说明:
增加:
新增此资源物件。
复位:
将此资源物件数值恢复初始值。
监测周期,以毫秒(MS)
3.6.1.4主机别名资源:
•文字内容说明:
资源物件名称:
新增主机别名资源名称,以供辨识之用。
主要服务器:
选择所要管理此资源物件的主要服务器。
备援服务器:
显示管理此资源物件的备援服务器。
释放资源失败时可跳过:
当资源物件发生异常而释放资源物件做切换时,可选择是否忽略资源释放失败的错误。
自动切换回车:
决定是否自动切换回原本托管之主机(AutoSwitchBack)。
定期监测周期:
设定资源物件的监测周期,以毫秒(MS)为单位。
监测作业重试次数:
设定资源物件的监测重试次数,此次为单位。
资源启动逾时设定:
设定此资源物件之启动逾时时间,以毫秒(MS)为单位。
资源停止逾时设定:
设定此资源物件之停止逾时时间,以毫秒(MS)为单位。
依存子资源:
选择此资源物件所依存的子资源物件名称。
可选择的依存子资源:
可供选择的依存子资源清单。
主机别名资源:
填入您想要托管的主机别名资源名称。
•按钮内容说明:
增加:
新增此资源物件。
复位:
将此资源物件数值恢复初始值。
3.6.1.5磁盘资源
文字内容说明:
资源物件名称:
新增磁盘资源名称,以供辨识之用。
主要服务器:
选择所要管理此资源物件的主要服务器。
备援服务器:
显示管理此资源物件的备援服务器。
释放资源失败时可跳过:
当资源物件发生异常而释放资源物件做切换时,可选择是否忽略资源释放失败的错误。
自动切换回车:
决定是否自动切换回原本托管之主机(AutoSwitchBack)。
定期监测周期:
设定资源物件的监测周期,以毫秒(MS)为单位。
监测作业重试次数:
设定资源物件的监测重试次数,此次为单位。
资源启动逾时设定:
设定此资源物件之启动逾时时间,以毫秒(MS)为单位。
资源停止逾时设定:
设定此资源物件之停止逾时时间,以毫秒(MS)为单位。
磁盘资源:
选择您想要托管的磁盘资源名称。
•按钮内容说明:
增加:
新增此资源物件。
复位:
将此资源物件数值恢复初始值。
3.6.1.6自定义资源:
文字内容说明:
资源物件名称:
新增自定义资源名称,以供辨识之用。
主要服务器:
选择所要管理此资源物件的主要服务器。
备援服务器:
显示管理此资源物件的次要服务器。
释放资源失败时可跳过:
当资源物件发生异常而释放资源物件做切换时,可选择是否忽略资源释放失败的错误。
自动切换回车:
决定是否自动切换回原本托管之主机(AutoSwitchBack)。
定期监测周期:
设定资源物件的监测周期,以毫秒(MS)为单位。
监测作业重试次数:
设定资源物件的监测重试次数,此次为单位。
资源启动逾时设定:
设定此资源物件之启动逾时时间,以毫秒(MS)为单位。
资源停止逾时设定:
设定此资源物件之停止逾时时间,以毫秒(MS)为单位。
依存子资源:
选择此资源物件所依存的子资源物件名称。
可选择的依存子资源:
可供选择的依存子资源清单。
启动程序:
选择启动程序路径。
停止程序:
选择停止程序路径。
代理程序:
选择代理程序路径。
代理程序超时设定:
代理程序超时设定,以毫秒(MS)为单位。
目标资源:
选择代理程序所要托管的服务资源。
•按钮内容说明:
增加:
新增此资源物件。
复位:
将此资源物件数值恢复初始值。
3.6.2个别资源物件操作
在设定完成资源物件之后,即可透过点选资源物件的方式进行个别资源物件的变更、导入、复位与删除。
使用者必须注意的是,当物件导入运行中,是无法改变任何参数的,需等待资源物件导出之后才能够进行更改,更改之后请按下变更以更新参数值。
另外在个别物件导入中,可进行个别物件的切换到对等端、导出与复位工作,可依照使用者喜好而进行资源物件的变化。
3.6.3事件纪录内容说明
事件纪录卷标详载关于DataWare核心的状态,使用者可藉由观察事件纪录的内容而得知目前DataWare核心是否正常运作,当发生异常情况时,使用者亦可轻易地从事件纪录得之发生何种异常情况。
•文字内容说明:
若要查询除本日之外的日期,使用者须设定开始日期以及结束日期(两者
皆需要输入),以供系统查询之依据。
开始日期(yyyy-mm-dd):
输入开始查询之日期,例如2003-05-01。
结束日期(yyyy-mm-dd):
输入结束查询之日期,例如2003-05-05。
•按钮内容说明:
查询:
查询之前所纪录之事件。
今天:
观察本日所纪录之事件
3.6.4系统设定内容说明:
系统说明卷标包含产品注册信息、画面设定、主机名称、参考点IP、以及系统组态。
此为DataWare系统可以正常运作的最基本一项设定
•文字内容说明:
产品序号:
DataWare安装之后自动产生出的一组序号。
注册码:
提供使用者取得DataWare使用认证之栏位。
试用期剩余天数:
未注册取得认证之DataWare软件均有30天试用期,此字段为距离试用期到期之天数,若已经取得认证,则系统会显示(已经注册)。
画面更新频率(秒):
设定系统画面更新频率,以秒为单位,默认值为10。
画面语言设定:
设定使用者之语言,选项有English、TraditionalChineseSimplifiedChinese。
本地端主机名称:
显示本地端主机之名称。
对等端主机名称:
提供使用者输入对等端主机之名称以供核心辨认之用。
参考点IP:
提供除了本地端/对等端之外的第三台主机之参考点IP,以供本地端/对等端当发生状况时,执行自我侦测能力。
服务器关机时,不要自动切换资源物件:
提供使用者自行定义当服务器关机时,要不要自动切换资源。
服务器开机时,自动启动双机容错系统:
提供使用当本地端/对等端主机开机时,是否要自动启动双机容错系统。
•按钮内容说明:
注册:
注册信息确认按钮,将注册码填入方可生效。
变更:
将变更过的参数做更新。
复位:
将参数恢复初始值
4.DataWare范例
4.1安装DAWARE软件:
4.1.1双击daware安装程序,按默认安装就行了。
4.1.2修改daware服务的登录密码:
打开,控制面板---管理工具---服务,然后在dataware服务的属性里修改登录密码。
然后启动这个服务。
4.1.3修改IIS:
(注:
如果系统没有添加ASP组件,那么须要在添加/删除里添加。
打IIS管理器,在网站里可以看到一个DataWare网站,进入网站属性,修改其端口,选择主目录,修改如图:
然后点击配置,选择“选项”,将“启用父目录”打上勾。
选择文档标签,将Default.asp上移到顶部。
4.1.4在IE地址输入IP:
端口打开软件的管理介面。
4.1.5设置主机:
4.1.6读取对等主机NIC
4.1.7设置私有网络:
先把当前设置网页关闭,然后再打开,进入私有网络进行如下设置:
4.1.8添加COM+组件:
(注:
如果你的操作系统为win2000或win2003没有打sp1以上补丁,此步可以不用,不然DATAWARE总是提示“系统核心服务尚未启动”。
)
打开,控制面板---管理工具---组件服务,在COM+应用程序中建立一个名为“dataware”的空的应用程序,选择服务器应用程序--网络服务,其它默认.建立成功后在里面添加新的组件--导入已注册的组件--“Dealini.admin.1”,然后选择建好的dataware属性,把安全中的“对应用程序强制进行访问检查”的勾给去掉,然后先关闭再启动,然后重新启动两台虚拟机就OK了。
4.1.9启动双机容错系统:
(以上操作须在两台机子上都做)
4.1.10添加IP资源:
选择“资源物件”,增加资源物件中选择“IP地址”,点击添加。
4.1.11添加磁盘资源:
选择“资源物件”,增加资源物件中选择“磁盘”,点击添加。
4.1.12导入资源:
进入刚才建立好的相应资源,选择导入。
4.2.DataWare自我检测
当安装及设定完DataWare软件之后,使用者请先自我检测DataWare软件是否正常运行,以下提供几个检测步骤让使用者作为参考之依据。
4.2.1检测主机名称:
环境假设:
Host1主机名称:
NT1
IP:
192.168.10.55
PrivateNetIP:
192.168.0.1
Host2主机名称:
NT2
IP:
192.168.10.56
PrivateNetIP:
192.168.0.2
当安装完DataWare双机容错软件之后,请在本地端/对等端主机的系统设
定字段输入对方主机的名称,接下来按下「变更」以储存设定,如图所示。
4.2.2检测NIC设定:
透过服务器标签内的NIC字段,按下「读取对等主机NIC」,可以观看自身以及对等主机之MacAddress、IPAddress以及SubnetMask设定,在DataWare双机容错软件启动之前,请确认此标签内参数为正确值,如图所示。
4.2.3检测私用网络设定:
在私用网络卷标设定,当第一次使用时,使用者必须要让三者私用网络(网络型、串行端口、共享磁盘)之一勾选「启动双机容错系统时,自动开启」,之后按下「更新」,以便储存其设定,本地端/对等端主机都必须做此动作,如下图示