系统分析师技术指南.docx
《系统分析师技术指南.docx》由会员分享,可在线阅读,更多相关《系统分析师技术指南.docx(33页珍藏版)》请在冰豆网上搜索。
![系统分析师技术指南.docx](https://file1.bdocx.com/fileroot1/2023-2/8/097f80a5-860a-4696-abab-02b87bc08638/097f80a5-860a-4696-abab-02b87bc086381.gif)
系统分析师技术指南
第1章CMM与软件过程改进
软件过程的建模主要使用过程建模语言PML。
PML最基本的功能是用来描述和定义过程、建立过程模型。
CMM的基本框架:
1.初始级:
软件过程的特点是无秩序的,有时甚至是混乱的。
2.可重复级:
已经建立了基本的项目管理过程,可用于对成本、进度和功能特性进行跟踪。
3.已定义级:
用于管理和工程的软件过程均已文档化、标准化、并形成整个软件组织的标准软件过程。
4.已管理级:
软件过程和产品质量有着详细的度量标准,软件过程和产品质量得到宣的认识和控制。
5.优化级:
不断地、持续地进行过程改进。
改进方向:
1.初始级的改进方向:
建立项目过程管理。
实施规范化管理,保障项目的承诺。
2.可重复级的改进方向:
总结已实施的各种项目的成功经验,使之规则化。
3.已定义级的改进方向:
着手软件过程的定量分析。
4.已管理级的改进方向:
防范缺陷,主动进行技术改革管理,进行过程变更管理。
5.优化级的改进方向:
保持持续不断的改进软件过程。
公共特性:
1.执行约定
2.执行能力
3.实施活动
4.度量和分析
5.实施验证
软件过程评估所针对的是软件组织自身内部软件过程的改进问题,目的在于发现缺陷,提出改进方向。
软件能力评价是对接受评价者在一定条件下,规定时间内能否完成特定项目的能力考核,即承担风险的系数大小。
ISO9001与CMM的比较
1.CMM模型明确强调持续的过程改进,而ISO9001只要求质量体系的最小保证。
2.CMM模型只关注软件,而ISO9001适用于更大的范围。
CMMI的表示法:
1.阶段式:
强调的是组织的成熟度,从过程域集合的角度考察整个组织的过程成熟度阶段,其关键术语是“成熟度”
2.连续式:
强调单个过程域的能力,从过程域角度考察基线和度量结果的改善。
其关键术语是“能力”。
CMMI级别:
1.初始级:
以不可预测结果为特征的过程成熟度
2.已管理级:
以可重复项目执行为特征的过程成熟度
3.严格定义性:
以组织内改进项目执行为特征的过程成熟度
4.定量管理级:
以改进组织性能为特征的过程成熟度
5.优化级:
以可快速进行重新配置的组织性能,以及定量的、持续的过程改进为特征的过程成熟度。
CMM与CMMI的比较
1.CMMI强调了对需求的管理,有两个过程域说明。
CMM只有一个过程域
2.CMMI加强了对工程管理的重视,CMM只一个SPE关键过程来要求和指导
3.CMMI强调了度量,CMM没有专门的要求
4.CMMI强调了风险的管理,CMM只一个过程。
PSP是一种可用于控制、管理和改进个人工作方式的自我持续改进过程,是一个包括软件开发表格、指南和规程的结构化框架。
CMM软件企业中有关软件过程的宏观管理,面向软件开发单位,PSP则侧重于企业中有关软件过程的微观优化,面向软件开发人员。
第2章J2EE与.NET平台
第3章中间件技术
中间件是一类软件,而非一种软件
中间件不仅仅实现互联,还要实现应用之间的互操作
中间件是基于分布式处理的软件,最突出的特点是其网络通信功能
中间件的基本分类:
1.底层型中间件
2.通用型中间件
3.集成型中间件
中间件的详细分类:
1.通信处理(消息)中间件:
在不同平台之间通信,实现分布式系统中可靠的、高效的、实时的跨平台数据传输。
2.事务处理(交易)中间件:
由事务处理中间件、通信处理中间件以及数据存储管理中间件须组成。
3.数据存储管理中间件。
4.Web服务中间件
5.安全中间件
6.跨平台和构架的中间件
7.专用平台中间件
8.其他中间件
构件技术与中间件
1.中间件构件存在的基础
2.面向需求的构件应用
3.使业务逻辑容易划分:
提供业务的分隔和包容性
4.构件的封装、设计与实现隔离
5.隔离应用构件与复杂系统资源
6.符合标准的交互模型
7.软件重用
8.提供对应用构件的管理
9.构件思想对中间件的作用
在分布的环境中统一使用这些资源
中间件的设计目标是互操作
中间件的应用范围越来越广
中间件不是最终的应用
中间件有可配置性的需要
中间件的发展趋势:
1.规范化
2.构件化和松耦合
3.平台化
第4章应用服务器
二层计算模式的问题:
1.数据库服务器成为瓶颈,而且不能够靠升级硬件解决;
2.开发工具缺少批量处理功能,不能够迅速处理大量的数据;
3.业务规则的改变会引起客户端软件的变化,从而需要重新部署、升级大量的客户端软件。
应用服务器的作用:
1.可升级性:
负载均衡技术
2.分布式处理
3.可重用的业务对象
4.业务规则
5.跨平台集成
应用服务器的用途:
1.集成遗留系统和数据库
2.为Web站点提供支持
3.开发Web集成系统
4.个人计算机的部署
5.电子商务
1)业务逻辑的实现与扩展
2)稳定可靠的性能
3)快速有效的开发模式
6.性能管理
负载均衡技术:
1.负载分配算法:
精确遥负载分配
2.基于统计的负载分配
在应用服务器本身的实现上有:
基于进程和基于线程的两种方式
应用服务器的类型:
1.根据技术实现分类
1)操作系统型
2)集成型
3)插件型
4)独立型
2.根据功能分类
1)事务服务器
2)知识服务器
3)带有集成开发工具的应用服务器
4)瘦服务器
5)主机访问服务器
应用服务器的成本
1.采用应用服务器体系是一种长期的、企业级的投入
2.中间件获取成本
3.新的思维方式
4.软件的重用
应用服务器发展过程与方向
1.基于Web的中间层服务
2.基于事务处理的中间层服务
3.综合性中间层服务
应用服务器的选择
1.生产性和复用性
2.可伸缩性和可靠性
第5章WebService及其应用
WebService是解决应用程序之间相互通信的一项技术
WebService模型中的角色:
(1)服务提供者:
定义并实现WebService,使用描述语言对WebService进行详细、准确、规范的描述,并将该描述发布到服务注册中心供服务请示者查找并绑定使用。
(2)服务请求者:
WebService的使用者。
(3)注册服务中心:
(可选)服务提供者在此发布他们的服务描述,而服务请求者在服务注册中心查找他们需要的WebService
WebService模型中的操作:
发布、查找、绑定。
WebService中的常用协议:
(1)WSDL
描述的重点是服务,包含:
ServiceImplementationDefinition和ServiceInterfaceDefinition.
服务实现定义中包含Service和Port描述
WSDL文档是按照WSDL语法规范描述某个特定WebService的文档,是一个简单的XML文档。
WSDL文档是由程序使用的。
目标是描述如何使用程序来调用WebService
(2)UDDI
用于描述、发现、集成WebService的技术,它是WebService协议栈的一个重要部分,企业可以灵活地发布和查找WebService。
UDDI技术规范包括:
UDDI数据模型:
用于描述商业组织和WebService的XMLSchema
UDDIAPI:
用于查找或发布UDDI数据的方法,基于SOAP。
UDDI商业注册服务:
是WebService中的一种基础设施。
UDDI定义数据结构:
businessEntity、businessService、bindingTemplate、tModel
使用UDDI注册WebService的步骤:
为UDDI条目建立模型,将UDDI适配卡注册到UDDI注册中心。
第6章数据仓库技术
面向事务处理的传统数据库的问题:
系统的响应问题、数据集成问题、数据的动态集成和更新、历史数据问题、决策操作问题。
数据仓库是一个面向主题的(指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。
)、集成的(最重要的)、非易失的、且随时间变化的数据集合,用于支持管理决策。
数据仓库反映历史变化的属性:
-数据仓库的数据时间期限为数年、几十年。
-数据仓库中的数据仅仅是一系列某一时刻生成的复杂的快照。
-数据仓库中一定会包含时间元素。
与数据仓库技术相关的其他概念:
维:
数据按维来组织的,维同时也就构成了数据仓库中识别数据的索引。
上卷:
指在数据仓库的应用中,从较低层次的数据开始逐步将数据按照层次进行概括处理
下钻:
指从数据仓库串的高层数据开始逐步走向底层数据,探索、了解概括性数据的具体细节。
数据立方体:
是包含用户需要观察数据的集合体,它提供企业所感兴趣商业事务。
聚类:
指收集了基本事务数据的结构。
数据仓库与传统数据库的比较
比较项目
数据库
数据仓库
数据内容
当前值
历史的,归档的,归纳的,计算的数据
数据目标
面向业务操作程序、重复操作
面向主题域,分析应用
数据特性
动态变化、更新
静态、不能直接更新、只能定时添加、更新
数据结构
高度结构化、复杂,适合操作
简单、适合分析
使用频率
高
低
数据访问量
每个事务一般只访问少量
每个事务一般访问大量记录
对响应时间的要求
计时单位小,如秒
计时单位相对较大,除于秒,还有分钟,小时
数据仓库的概念结构:
包含数据源、数据准备区、数据仓库数据库、数据集市/知识挖掘以及各种管理工具和应用工具。
数据仓库的参考框架:
数据仓库基本功能层、数据仓库管理层和数据仓库环境支持层。
1.数据仓库基本功能层:
包含数据源、数据准备区、数据仓库结构、数据集市或知识挖掘库,以及存取和使用部分。
数据源:
指存储在数据仓库中的数据来源。
数据准备区:
由数据标准化处理、数据过滤和匹配、数据净化处理、表明数据的时间戳、确认数据质量以及数据抽取和创建等操作组成。
数据仓库听功能结构:
由数据重整、数据仓库创建和元数据管理组成。
数据集市或知识挖掘库:
包含求精与重整、数据集市/知识挖掘创建、元数据管理。
数据仓库听数据存取与使用:
分成数据仓库存取与检索、数据仓库分析与报告。
2.数据仓库管理层:
由数据仓库的数据管理和数据仓库的元数据管理组成。
数据仓库的数据管理层:
包含数据抽取、新数据需求与查询、数据加载、存储、刷新和更新系统,安全性与用户授权管理系统以及数据归档、恢复及净化系统。
数据仓库的元数据管理层:
负责数据仓库所使用的元数据的管理,包括数据仓库、数据集市和词汇表管理,元数据抽取、创建、存储和更新管理,预定义的查询和报表以及索引管理,刷新与复制管理,登录、归档、恢复与净化管理。
3.数据仓库的环境支持层:
由数据仓库数据传输层和数据仓库基础层组成。
数据仓库的传输层:
包含数据传输和传送网络、客户/服务器代理和蹭件、复制系统以及数据传输层的安全保障系统。
数据仓库的基础层包含:
系统管理、工作流程管理、存储系统和处理系统。
大众观点的数据仓库体系结构:
⏹数据源:
是数据仓库系统的基础,是整个系统的数据源泉。
⏹数据的存储与管理:
是整个数据仓库系统的核心。
企业级数据仓库部门级数据仓库
⏹OLAP服务器:
对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。
⏹前端工具:
包括各种报表工具、查询工具、数据分析工具、数据挖掘以及各种基于数据仓库或数据集市的应用开发工具。
数据仓库的开发、实施步骤:
(1)业务需求分析
(2)逻辑模型设计
(3)物理模型设计
(4)数据抽取、清洗、集成、装载
(5)数据仓库的管理
(6)数据的分析、报表、查询。
(7)数据仓库性能优化及发布。
数据管理技术
(1)大批量数据管理
(2)数据仓库的高效索引与数据监视技术
(3)元数据管理技术
(4)数据压缩技术
(5)复合键码技术
数据存储技术
(1)多介质存储设备的管理技术
(2)数据存储的控制
(3)数据的并行存储与管理
(4)可变长技术
(5)锁切换技术
数据仓库接口技术
(1)多技术的接口
(2)语言的接口
(3)数据的高效率加载
第7章数据挖掘技术
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息知识的过程。
数据挖掘是一类深层次的数据分析方法。
数据挖掘可以描述为:
按企业既定业务目标,对大量的企业数据进行探索和分析,提示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。
数据挖掘与传统的数据分析的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识、数据挖掘所得到的信息应具有先前未知,有效和可实用三个特征。
数据挖掘技术从一开始就是面向应用的。
数据挖掘的功能:
1.自动预测趋势和行为
2.关联分析
3.聚类
4.概念描述
5.偏差检测
数据挖掘常用技术
1.关联分析:
用于发现不同事件之间的关联性,妈一个事件发生的同时,另一个事件也经常发生。
重点在于快速发现那些有实用价值的关联发生的事件。
主要依据是事件发生的概率和条件统计意义。
2.序列分析:
主要用于发现一定时间间隔内接连发生的事件。
3.分类分析:
通过分析具有类别的样本的特点,得到决定样本属于各种类别的规则或方法。
基于:
贝叶斯方法、神经网络方法、决策树方法、supportvectormachines。
4.聚类分析:
根据物以类聚的原理,将本身没有类别的样本聚集成不同的组,并且对每个这样的组进行描述的过程。
5.预测:
根据样本的已知特征估算某个连续类型的变量的取值的过程。
常用的技术是回归分析。
6.时间序列分析:
随时间而变化的事件序列。
数据挖掘工具简介
1.基于神经网络的工具
2.基于规则和决策树的工具
3.基于模糊逻辑的工具
4.综合多方法工具
数据挖掘工具的评价标准
1.解决复杂问题的能力
2.易操作性
3.数据存取能力
4.与其他产品的接口
数据挖掘的流程
1.问题定义
2.建立数据挖掘库
3.分析数据
4.高速数据
5.模型化
6.评价和解释
Web数据挖掘的难点
1.异构数据库环境
2.半结构化的数据结构
3.解决半结构化的数据源问题
第8章操作数据存储
为了特定目的而整合数据
ODS的特点包含实时模式下动态更新的当前数据。
一个操作数据存储是一个包含了面向主题的、集成的、可变的、当前的(或接近当前的)操作信息。
ODS能支持企业日常的全局应用的数据集合,是不同于数据库(DB)的一种新的数据环境,是数据仓库(DW)扩展后得到的一个混合形式,是一个集成了来自不同操作数据库数据的环境。
其目的是为终端用户提供一致的企业数据集成视图。
它可以使用户轻松应对跨多个商业功能的操作挑战,作为一个中间层次,它算不上事务处理,也算不上高层决策分析。
ODS的分类:
1.Class-I型:
以同步方式将信息加载到ODS中。
2.Class-II型:
以存储转发方式将数据加裁到ODS中。
更新频率为数小时一次或更频繁。
3.Class-III型:
更新频率通常为日加载。
ODS和DW的联系与区别
1.当前数据
ODS是数据的当前视图,包含了当前和近似当前的数据。
DW中的数据是长期保存并可重复查询的数据,它更多地反映了商业环境的历史视图。
ODS通过提供当前或准实时的集成信息,满足组织机构日常的操作数据要求;而DW通过提供更多的历史信息,支持组织机构的情报和战略要求。
2.更新/载入数据
ODS是实时或准实时的更新机制。
DW的更新通常是集中进行的,通过预先确定的时间点向DW中载入数据。
3.数据汇总
ODS包含了基础的详细数据,只有在需要时才综合和汇总,并且只有在生成时是准确且不可重建和保存的。
动态汇总数据
DW中既保存细节数据,也保存汇总数据。
静态汇总数据。
4.数据建模
ODS是为记录级别的访问而设计的。
3NF
DW是为结果集的访问而设计的。
5.查询和交易
ODS中的交易量很小。
DW查询或分析工作量很大。
6.使用
ODS用于职员或企业制定日常决策。
是日常性的。
DW服务于决策支持系统(DSS)分析员或高级决策层。
是战略性的。
7.用户
ODS适用于日常用户
DW则更多地用于战略用户群
8.数据量
ODS包含的数据量比DW少的多
ODS提供了全局一致的联机事务(OLTP),而DB只适用于部门级的OLTP。
操作型环境中各分散的DB记录经过过滤后形成了ODS的记录系统,向ODS系统中提供数据。
ODS应用主要有:
作为一种独立的解决方案为需要集成操作环境的企业提供全局一致的应用;
作为从DB向DW的一种过渡形式,建立一种基于DB-ODS-DW的三层体系结构的决策支持系统解决方案。
操作数据存储系统的设计
1.ODS数据转换层
主要完成从源数据系统到ODS系统的数据转换、净化和载入
转换系统应具有下述功能:
1)支持大量源和目的平台
2)对变化进行捕捉的能力
3)支持多种类型的转换
4)对设计方法的变化具有透明性
5)提供数据的可靠传输
6)对元数据的支持
2.ODS平台
1)规模伸缩性
2)对多种大型网络环境的支持
3)事务监视管理功能
4)处理大量查询的能力
5)提供混合作业处理的能力
6)分布数据的一致映射
3.ODS中间件
1)对多种类型客户接口的支持
2)提供对多种关系型及非关系型数据库的兼容性
3)提供监视及收集统计数据的功能
4)提供查询作业排队及计划管理功能
ODS的系统数据建模
1.实体关系模型(ERM)建模:
实体、关系
2.维度建模:
事实、维度、度量
ODS系统设计步骤
1.确定数据范围
2.进一步数据分析和主题定义
3.定义主题元素
1)定义维的概念特性
2)定义度量的概念特性
3)定义粒度
4)定义存储期限
4.迭代和归并维的定义
5.物理实现
第9章异构数据库的集成
异构数据库系统是相关的多个数据库系统的集合,可以实现数据的共享和透明访问。
异构性体现在:
(1)计算机体系结构的异构
(2)基础操作系统的异构
(3)DBMS本身的异构
异构数据库系统的目标在于实现不同数据库之间的数据信息资源、硬件设备资源和人力资源的合并和共享。
其中关键的一点就是以局部数据库模式为基础,建立全局的数据模式或全局外视图。
异构数据库系统实现数据共享应达到:
实现数据库转换;实现数据的透明访问。
数据库转换是将数据库转换成用户等价数据模型,然后根据需要再装入数据,使用户利用自己数据库系统和查询语言方便地使用以实现数据共享。
需要做以下工作:
访问数据库系统,复制一个源数据库的副本,把源数据库的副本转换为等价的目标数据库,把转换好的目标数据库装入与目标数据库相应的数据库系统,用目标数据库管理系统中的数据处理语言访问目标数据库。
冲突:
命名冲突、格式冲突、结构冲突。
ODBC的体系结构:
(1)应用程序
(2)驱动程序管理器
(3)驱动程序
(4)数据源
数据网关允许一个本地DBMS用户访问另一个相同或不同平台平台上的DBMS,用户不必知道数据库所使用的存取机制。
(1)客户API库
(2)服务器API库
第10章企业应用集成
EAI是指企业范围内,将多个应用系统的过程、软件、标准和硬件集成起来,合其成为无缝动作的整体。
Portal是指基于WebService技术、经过后台业务整合的单一访问界面,是EAI的一种主要技术表现形式。
EAI的层次
1.业务过程集成(BPI):
包括过程管理、过程建模和工作流
2.应用集成
3.数据集成:
是应用集成和业务过程集成的基础。
要对数据进行统一标识、分类,并进行元数据建模。
EAI的技术要素:
1.集成的技术标准
2.应用集成的平台
EAI的好处:
1.增进与客户的联系
2.增强供应链间的联系
3.改善内部流程
4.减少市场化周期
集成模型:
是指一种用来集成软件的特定方法和结构,定义了集成的特性和机制,并由此决定如何将软件集成在一起。
1.表示集成:
就是想创建一个新的用户界面,使用现有的表示逻辑模块来访问原有应用软件,用户的每个操作都将映射到原有的系统中去。
屏幕截取、输入模拟技术是常用的集成技术。
2.数据集成:
跳过界面和作业逻辑层,直接从应用软件的数据库或数据结构开始进行集成。
3.功能集成:
是在业务逻辑层上进行集成的。
也是黑盒集成。
1)远程过程调用(RPC)
2)面向消息的中间件(MOM)
3)分布式对象技术
4)事务处理监控器(TMP)
EAI的标准层次
1.应用层标准:
在特定的信息化应用背景下,对信息内容、语义、信息处理逻辑的规定。
可以直接用于指导住信息化应用的建设。
1)内容标准
2)技术标准
3)过程标准
2.元标准:
用于描述其他应用标准的标准。
EAI实施要点
1.集成原则
2.标准原则
3.管理配套原则
4.“拿来”原则
企业实施EAI的4个阶段
1.局部试点阶段
2.建立体系结构阶段
3.推广体系结构阶段
4.企业EAI化阶段
第11章可扩展标记语言
XML的特点:
1.简洁有效
2.易学易用
3.开放的国际化标准
4.高效且可扩充
XML带来的好处
1.使搜索更有意义
2.开发灵活的Web应用软件
3.实现不同数据的集成
4.使用于多种应用环境
5.客户端数据处理与计算
6.数据显示多样化
7.局部数据更新
8.与现有Web发布机制相兼容
9.可升级性强
10.压缩性能高
第12章软件构架
软件构架为软件系统提供了一个结构、行为和属性的高级抽象,由构成系统的元素的描述、这些元素的相互作用、指导元素集成的模式以及这些模式的约束组成。
软件构架的模型:
1.结构模型:
构架描述语言
2.框架模型
3.动态模型
4.过程模型
5.功能模型
最终用户:
功能需求编程人员:
软件管理
系统集成人员:
性能可扩充性、系统工程人员:
系统拓扑、
吞吐量等安装、通信等
逻辑视图:
主要支持系统的功能需求,即系统提供给最终用户的服务。
用类图来描述逻辑视图。
逻辑视图设计中要注意的主要问题是要保持一个单一的、内聚的对象模型贯穿整个系统。
开发视图:
也称模块视图,主要侧重于软件模块的组织和管理。
进程视图:
侧重于系统的运行特性,主要关注一些非功能性的需求。
强调并发性、分布性、系统集成性和容错能力,以及从逻辑视图中的主要抽象如何适合进程结构。
物理视图:
主要考虑如何把软件映射到硬件上,它通常要考虑到系统性能、规模、可靠性等。
场景:
可以看做是那些重要系统活动的抽象,使4个视图有机联系起来。
逻辑视图和开发视图是描述系统的静态结构,而进程视图和物理视图描述系统的动态结构。
软件构架风格是描述某一特定应用领域中系统组织方式的惯用