1、门户网站策划书门户网站策划书一、概述xx局是江苏省委、省直接关心和支持建立的唯一的大型重点综合性新闻门户网站,它承担着正确引导网上舆论、及时传播江苏信息、汇集全省新闻资源、全面拓展网络服务的职能。易宝北信在网站建设方面有雄厚的技术实力和很多成功经验,愿全力支持xx局的网站建设。我们相信,xx局领导的超前意识和科学决策,加上易宝北信的核心技术和成功经验,我们能够建成一个具有“实用性、安全性、可靠性、方便性、扩展性、先进性、标准化”的xx局网站业务支撑平台,圆满完成网站改造建设工程的设计目标。通过xx局与易宝北信的合作,充分运用易宝北信在网站建设方面的实力和经验,整合后的xx局将实现内容管理平台、
2、信息服务平台、业务管理平台以及商务服务平台的统一,从而实现新闻的实时发布、信息的快速传播、内容的有效整合、资源的便捷共享、社区的即时交流、服务的双向互动,成为江苏新闻在网络上最权威的媒体,江苏全省新闻信息资源的汇集之地,同时xx局还将作为一个可靠的网络技术平台,为江苏全省各新闻媒体上网提供广泛服务。改造后的xx局的系统要求网络结构更加安全合理、服务器架构更加稳定实用、应用系统更加方便可靠、业务系统更加快速高效。整个系统应包含以下几个子部分:1 网络管理系统:包括网络结构、服务器架构与有关硬件设备部署的整合设计。2 应用管理系统:包括web服务、数据库服务、应用服务、邮件服务的整合设计;3 业务
3、管理系统:包括网站内容管理、社区论坛、资源管理、视频点播、短信娱乐、广告管理等业务内容的整合设计;4 网络安全系统:包括数据存储备份恢复、系统监控、流量分析、应用审计等网络安全的整合设计;二、需求分析2.1 异构系统根据xx局提供的资料,目前所使用的服务器配置如下:序号 型号 操作系统 配置1 ibmrs6000-h80 aix 4.3 cpu: 内存:2g2 ibmrs6000-h80 aix 4.3 cpu: 内存:1g3 机架服务器 windows 2000 cpu: 内存:1g4 ibmnetfinity7100 freebsd cpu: 内存:1g5 ibm netfinity 56
4、00 linux cpu: 内存:1g6 自配pc机 windows 2000 cpu: 内存:512m7 xseries 255 linux cpu:2 内存:1g8 浪潮 nl 120p windows 2000 cpu: 内存:1.5g从上表可以看出,在仅有的8台服务器中,存在小型机、塔式服务器、机架服务器、pc机等多种机型,从配置上看,没有任何两台机器是完全相同的,8台服务器中并存了4种操作系统(aix、windows 2000、freebsd、linux),这给系统管理带来了极大的不便。首先,从管理难度上 看,可以按aix、freebsd、linux、windows 2000排序,排
5、序越靠前的系统,精通的人越少,管理成本越高,而同时精通四种系统的人成本就更是可想而知。如果在低成本下勉强进行维护,则系统的稳定性、安全性都无法得到保证,长期持续,整个网站的硬件基础令人担忧。其次,从互换性上看,如果一台服务器发生故障,很难用其它服务器直接替换,必然会延长故障修复时间,造成网站长时间处于不可用状态,严重影响用户使用及xx局的形象。第三,从服务器的利用角度看,两台最健壮的rs6000小型机不是用于最核心的数据库服务,而是用于web相关服务,其卓越性能无法得到发挥,反而由于不是采用分布式负载均衡结构而严重影响了用户访问速度和网站的大访问量承载能力。必然造成网站访问速度日益下降。其效果
6、就如同用推土机参加赛车一样,其马力再强劲也没有用处,因为它的设计用途就不是在速度上而是在耐力上。从alexa网站(,世界上最权威的第三方网站评价站点)上xx局的排名(近三个月的平均排名为3108)来看,虽然与地方新闻门户的领头羊千龙网(近三个月的平均排名为 333)和东方网(近三个月的平均排名为698)还有相当大的差距,但也应该是属于日访问量过百万pageview的大型新闻门户网站,目前的网站结构与这种高强度的访问要求是极不相称的。如果xx局的下一步目标是赶超东方网和千龙网的话,就更需要合理调整网站的整体硬件结构,以适应每天过千万 pageview的访问量。所有超大型网站在web服务层的结构基
7、本是一致的,即cache加上机架服务器群负载均衡。首先,专用的cache服务器对大访问量的承载力要远远超过普通服务器(通常可以达到1:5以上),因此,在服务器群前端使用专用的cache服务器是使网站能够适应千万级访问量的最佳解决方案。其次,web服务器通常都是采用多台配置相同的机架式服务器(每台价格均在10万元以下)通过专用的负载均衡设备形成web服务器群,从而很好地将用户访问流量平均分配到各个服务器上,便于随时扩展,也便于故障排除,因为任何一台服务器发生故障并被撤离的时候都不会影响到整个网站的访问,从而在最大程度上缩短了整个网站的不可用时间。而对于应用核心的数据库服务器,通常会采用双机热备援
8、,即两台数据库实时同步,互为备份,当一台发生故障时,另一台自动接管它的全部服务,确保所有应用不间断运行。当然,最重要的一点还是要及时进行数据备份,无论是数据库还是网页、文件都必须定时备份,以便在意外情况下可以在最短的时间内恢复,同时保证数据损失最小。目前的结构与建议结构相差太远,如果不花大力气彻底改造的话,上述问题将会不断加重,直至整个网站完全瘫痪。首先,要下决心统一硬件平台,尽管保护投资是非常重要的,但如果以网站的未来发展为代价显然是不值得的。ibm rs6000小型机尽管已过了保修期,但其性能仍然非常卓越,对于金融领域的建设项目非常有益,可以考虑与本地待建的金融项目进行相应协商,将两台小型
9、机置换成机架服务器,这对于建设双方而言都是非常有益的做法。如果置换困难的话,也建议将rs6000作为数据库服务器,rs6000对于oracle数据库的支持要远胜于windows 2000,但相应的成本会增加很多,维护起来的难度也将成倍加大。这个方法在技术上是可行的,但在维护上需要斟酌。从网站的长远发展看,建议将两台小型机单独考虑作为未来的电子商务类的盈利性支撑平台,在本次改造中将其上面的应用完全剥离出来;并重新规划整个网站的硬件平台,以ibm/hp/dell的机架式服务器完全重组,并考虑对旧设备充分进行利用。其次,要统一操作系统,除了aix以外,另外三种操作系统都可以考虑。单从安全性角度出发,
10、freebsd是比较好的选择,目前新浪、网易等综合门户使用较多,但是熟悉该系统的人相对较少。由于redhat以后将不会再推免费的linux,而且其安全性和稳定性也并不是比windows高出很多,因此完全使用linux也需要慎重考虑。windows 尽管口碑较差,但在实际应用中很多大的门户中仍有大量的windows服务器存在,包括搜狐、千龙等,如果有比较认真负责的系统管理员,windows 2000及其后续产品的综合成本还是最低的。而且包括windows系统资源占用过高等问题都可以通过比较专业的调优工作得到大幅度改善。一台 windows 2000的iis服务器在调优前后的性能差异可以高达数十倍
11、。建议采用freebsd或windows 2003中的一种统一操作系统,以降低整个网站的维护成本。2.2 异构应用xx局对外提供了很多种服务,其中社区、论坛、婚介、邮件等均是使用asp写的程序,而软件下载则是使用jsp写的程序,xx局内部的发布系统iflow也是基于的系统。为了保证跨平台应用和未来的迁移扩展,还是建议将程序写成版本,目前越来越多的web程序员均精通asp、jsp、php等多种脚本语言,改写起来非常方便。当然,应用程序的异构并不是太大问题,大多数网站都存在这种情况,但是应用程序编写的水平高低常会造成应用层安全漏洞,从而威胁整个网站的安全,如果在成本有限的情况下,考虑低成本的php
12、也不失为好的方案。2.3 异构数据发布系统iflow使用的数据库是windows版的oracle,而网站使用的动网论坛则使用的是access或sqlserver,如果按照清华万博的建议,将会把发布系统数据库迁移到mysql上。从数据库的性能上而言,oracle是当之无愧的最佳选择。而ibm的db2和微软的sqlserver 2000也表现不错。千龙网到2003年5月以后才将部分数据库开始向oracle迁移,而此前的应用一直是在sql server 2000上运行,效能是令人满意的。而mysql和access在多数方面与上述的大型数据库是无法比拟的,例如可以大幅度提升数据库查询性能的存储过程、可
13、以防止数据库错误发生的事务处理等高级性能它们都不支持。mysql的下一个版本虽然声称会加入这些性能,但未经过长期考验的数据库性能是不能令人信服的。因此将oracle数据库换成mysql是不明智的,应该说是一种倒退。而且将三个月以前的数据切断也不是好的做法。要知道对于一个新闻网站而言组织历史数据制作专题报道是非常重要的吸引网民的手段,也是作为新闻门户的立身之本。这就决定了切分历史数据将会给编辑的工作带来极大的不便。与sqlserver自动调优不同的是,oracle数据库对人工优化的依赖程度特别高,默认的安装选项几乎发挥不出oracle数据库性能的十分之一,而且oracle是支持群集和海量数据的最
14、佳选择,如果想快速发展的话,更没有理由不使用它了。xx 局目前数据库内的数据量为39万条,目前所购小型机已过了三年保修期,按xx局运行三年算,平均每天的新闻发稿量不到340条(当然发稿量一定是个渐近的数字,但就算平均到一年,每天也不过1050条左右),这一数字与千龙网、东方网每天的3000-5000条和新浪、搜狐每天的5000-10000条相比,根本算不了什么,因此绝不可能是因为数据库本身的性能影响了系统的速度。如果iflow系统可以从oracle移植到mysql上的话,那只能说明这套系统根本就没有就oracle数据库做过优化,没有利用任何大型数据库提供的高级功能,因此其访问效率必然十分低下。
15、2.4 网站结构事实上财经频道根本就不存在江苏频道里的内容。这说明了iflow生成的目录结构存在非常致命的问题,就是在同一天所有频道的内容都被混放在同一个目录中,然后通过不同的虚拟主机让用户产生不同频道的错觉,事实上根本没有办法把这些文件拆分开。这样的话,就没有办法轻易实现象新浪、搜狐、千龙那样的分布式结构,即每个频道都可以单独地采用一台或几台服务器,从而承载每天千万级甚至是亿级的访问量。这将会给未来的系统改造带来极大的麻烦。虽然使用完全对等的多台web服务器也可以实现负载均衡,但过度的冗余最终还是会影响到整个网站的性能。而且根据经验,这一拆分工作是十分艰巨的,估计至少会花费一个程序员三、四个
16、月的时间。这个问题也是必须解决的问题,是大型网站发展的重大瓶颈问题。2.5 内容海量根据刚才的分析,xx局目前的新闻更新量并不是很大,按照大多数新闻网站的发稿标准,每人每天的额定工作量应该是50篇新闻,如果要达到千龙、东方每天 3000-5000篇的发稿量,应该至少保证60-100人的编辑队伍,而要达到新浪、搜狐每天5000-10000篇的发稿量,应该至少保证100- 200人的编辑队伍。事实上这些网站根本就没有使用这么多的编辑。大多数网站,包括新浪、搜狐、千龙等均使用同一个自动信息采集软件(目前国内唯一能做到实用的,也是这几家大网站都统一使用的软件叫作newshoo,尽管同类的采集产品很多,
17、但都无法达到预期的采集效果)与内容管理系统对接,直接将合作媒体的网站信息采集和自动发布,每天可以完成近50%的工作量,从而大大提高了发稿数量,降低了人力成本。2.6 内容深度仅从梅艳芳逝世专题而言,xx局的专题丰富程度比起新浪、搜狐和千龙而言都有极大差距。一方面可能与发布系统的表现管理和专题组织速度有关,另一方面也与历史数据有关。由于几大门户网站一直在使用newshoo软件采集来自互联网上的信息并输入到自身的发布素材库中,因此编辑可以轻易找到很多可用素材,并且不必象在google上搜索一样要经过拷贝、粘贴、整理就可以直接使用。2.7 服务深度xx局提供了很多服务内容,从提出的改造需求看,改造后
18、的服务广度将会进一步加强。但就目前的几项服务看,做的深度都不够好。千龙网的论坛系统每天就可以形成200多万的pageview,在整个网站的访问量中占有很重要的作用,仅专职的论坛社区的相关维护人员就有十几个。xx局较有特色的软件下载等功能的实用性还远不如一些个人网站,如华军()、中国站长站()等,因此访问量不是很理想。从alexa的流量分布看,xx局的最大一部分流量是来自于其“时尚”频道,即,但在首页上竟然对时尚这一频道的体现非常不明显,看来对网站的日志及其它相关的客户访问分析工作还需要加强,并且需要加以充分利用。2.8 发布系统万博目前已经放弃了发布系统市场,而业内比较有名的发布系统包括trs
19、的wcm、千龙网的龙讯还有天极、搜狐自己的发布系统等都各有千秋。但是扩大到内容管理的范畴,即包括对整个网站的数据管理,目前国内的产品还都相对不太成熟,而国外的产品本地化做得又不好,所以目前十分理想的方案很难找到。最好的办法就是根据xx局目前的实际情况进行量体裁衣,出具具体的方案,有针对性的进行改造建设,2.9 网络安全对于新闻网站而言,安全是非常重要的。建立一个安全体系需要比较大的投资,目前安全系统相对比较成熟,以防火墙、漏洞扫描、入侵检测、网页防篡改等一系列产品构成的防护体系应该是必不可少的。此类产品国外的相对成熟一些,但是很多地方有国产化要求,具体选型需要根据情况酌定。尽管xx局一再声称网
20、络安全做得不好,但经过使用一些国内、外流行的黑客软件扫描后发现,除提供社区、婚介服务的机架式服务器上的serv-u版本过老存在一定的安全风险外,其它的系统状况还基本良好,至少不会在非应用程序层轻易被人攻破。2.10 信息安全关于信息安全,或者说是内容过滤,由于存在理论研究上的瓶颈,因此一直没有特别令人满意的产品出现,就研究水平而言,中科院软件所在这方面一直居于世界领先地位,但其成果距离实用产品还有差距,因此目前市面上能看到的过滤方案都不能代替人工审核。千龙网的论坛系统中已经做了比较复杂的内容过滤,但仍然需要大量的人力投入,足见信息安全方面目前还没有什么好办法。三、方案整体策划31设计目标通过对
21、xx局现状的分析,我们觉得目前改造后的xx局应达到以下目标:1网络结构合理实用:在进行网络方案设计时,考虑到技术变化、网速提高、用户发展和需求都处于不断变化中,首先应该满足应用的实际需求,做到适度超前,将实用性放在首位。2 服务规划稳定可靠:对现有主机服务器的设计规划应注重保护用户投资,在保证系统服务稳定可靠的前提下,充分利用现有的硬件设备和环境。3系统架构统一开放:异构系统带来的不仅仅是应用的复杂与信息的不通,更主要的是给用户和使用者带来的不便和繁琐,大大增加了系统的不稳定性和维护成本,我们将采取全局规划、分块迁移的方式,逐渐使系统架构在统一的平台和技术体系上,保证系统的平稳过渡和逐步扩展。
22、4 业务流程实用有效:良好的业务流程将有效提高系统的性能和人员的协调,通过对核心业务的分解和整合,建立完善包括技术、人员、操作流程等方面的业务管理体系。5 数据存储安全一致:数据是系统的基础和命脉,对数据存储的设计将在保证数据安全性的前提下,重新规划数据存储的格式和方式,通过数据备份、容灾、恢复以及数据挖掘技术的应用,提高数据的性能和利用率。32实施规划整个的xx局系统解决方案我们总体分为:网络解决方案(系统的网络结构与服务器架构及相关硬件设备)、软件解决方案(系统软件的选择、业务系统的划分与构成及实现的功能说明)。为保障xx局网站的成功改造建设、保护投资,我们拟采用集中设计、分步实施的方案进
23、行设计。整个方案我们建议分为两期进行实施:1期:时间待定主要工作:1 对网站设计策划、服务器结构、系统架构、应用系统和业务系统进行重新设计规划,提出整体解决方案;2 改造现有的网络结构,在充分利用用户已有硬件设备的前提下,根据需求增购部分网络设备、主机服务器、系统软件以及相关设备。3 针对原有系统中问题最集中的网站内容管理部分,重新置换内容管理系统,在保证系统正常运转的前提下,实施服务器、数据库、系统平台、应用系统平滑迁移工作。4 新系统与原有其他系统的数据与信息整合及相关二次开发工作;5 全面启用新系统及运行维护工作;2期:时间待定主要工作:1 社区论坛、资源管理、短信系统、广告管理、邮件管
24、理等系统二次开发、集成与整合;2 视频点播系统实施。3网络安全管理系统的升级,包括流量分析、系统监控、应用审计管理等。4 数据存储系统的升级与实施;5 全部系统的集成整合及运行维护工作;四、网络解决方案网站原有的服务器在应用方面还可以胜任工作,必须要添置的视具体情况而定。我们的想法就是减少投资,充分利用现有资源,合理分配已有的硬件资源,进行规划和布局。由于原来在数据备份上做的不够完善,所以建议这次改造要配置一套比较实用的数据备份系统。硬件解决方案,从以下方面进行合理组织工作,首先,给出整体硬件分布与规划的拓扑结构图。其次,针对应用功能,分配硬件产品。最后,对硬件产品进行详细介绍,了解硬件产品的
25、内部结构。4.1 拓扑结构图整个系统规划,是按照原来服务器分别放在idc和本地两个地方去设计的。大多数对外服务器放在idc,可以充分利用网络带宽。为了消除网站的单点故障,尽量保证网站全年99.99%的安全运行时间,因此各类应用原则上建议使用至少两台以上相同配置的设备,没有在图上在累赘画出同样配置服务器,但在下面叙述时要详细介绍。4.2 硬件选型、分布与规划服务器的选择主要考虑系统的可靠性、性价比、可维护性等。综合以上因素,我们建议采用hp公司机架式服务器作为网站服务器的推荐方案。4.2.1 数据库服务器对 于数据库服务器,推荐使用两台hp dl580服务器和一台光纤通道hp磁盘阵列(4块以上7
26、3g scsi硬盘做raid 5),使用专用的cluster软件实现双机oracle数据库热备援。hp dl580推荐配置:配置两颗xeon mp 2.8ghz、2gb ram、73g scsi硬盘。hp磁盘阵列推荐使用hp storageworks msa1000产品,保证系统的高可靠性、可扩展性和性能。鉴于web发布,需要访问数据库,并且,在内容管理与制作也需要访问数据库,而web服务器与内容服务器分别放于当地的idc和办公楼,所以,我们建议数据库服务器在这两个地方各放一套。4.2.2 web发布服务器所有在线编辑要登录到发布服务器编辑数据,制作网站信息,并将内容发布到发布服务器 上,对服
27、务器硬件配置的要求需要性能优良的服务器作支持, 服务器的配置可以使用春节前新购买的hp服务器,其具体配置为:机型:hp dl580 g2(企业级机架式服务器 厚度:4u)cpu:双mp xeon 2.0mhz 内存:2g 硬盘:73g*2 scsi 10000转。4.2.3 cgi服务器cgi服务器运行内容开发程序,在硬件配置上可选用另一台新购买的hp dl 580,其具体配置为:机型:hp dl580 g2(企业级机架式服务器厚度:4u)cpu:双mp xeon 2.0mhz内存:1g硬盘:36g*2 scsi 10000转。4.2.4 内容管理发布服务器所有在线编辑要登录到发布服务器编辑数
28、据,制作网站信息,并将内容发布到发布服务器上,对服务器硬件配置的要求需要性能优良的服务器作支持,建议硬件配置为:机型:hp dl580 g2(企业级机架式服务器 厚度:4u)cpu:双mp xeon 2.0mhz 内存:2g 硬盘:73g*2 scsi 10000转4.2.5 内容管理生成服务器发布服务器将编辑好的内容生成到生成服务器上,为静态html页面,并负责与外网的web服务器进行发布内容的同步,硬件配置可选择中型系统配置,我们建议使用原有的浪潮服务器。4.2.6 数据存储设备由于xx局对外服务器分别放在当地的idc和自己的办公地点,建议每个地点都使用一套数据存储设备。在本系统的存储设计
29、中,主要考虑系统的可扩展性和数据高可用性。在数据库服务器中,考虑到今后管理的网站会很多而且数据量也会比较大,因此需要采用扩展性和性能比较好的存储设备,建议采用外挂的磁盘阵列,初始可以考虑采用4块73g的磁盘作成raid5。为了保证系统的可扩展性和数据一致性,web服务器上的web静态页面不建议采用直接存储(das)的方式,而采用网络存储。通过比较目前主流的两种网络存储技术:san(storage area network)和nas(network attached storage),san基于光纤路径的网络存储,优点是性能好、可扩展性强,但是标准不统一,同时价格昂贵;而nas随着新的i/o路径
30、技术的采用已经逐步突破了原有的i/o瓶颈,并且技术成熟,性价比很高。存储业界的发展趋势是san和nas的融合。在本系统中对外提供的web内容以静态小文件为主,因此nas完全可以满足本系统的性能需求。采用nas存储web静态页面网站策划还要基于以下四个考虑:1 采用nas后,从wcm应用服务器上发布数据的时候可以直接发布到nas(通过nfs或cifs协议)中,和发布到本地磁盘中是一样的,而不需要经过ftp,这对于大数据量发布是比ftp方式更高效的;2采用nas可以作为本系统数据备份的存储设备;3 对于系统今后可能需要的大数据量存储提供扩展,如:视频服务,只需要添加磁盘就可以为系统提供更多的存储服
31、务;4采用网络存储还有一大优势可以突破scsi设备对存储i/o路径距离的限制(传统的并行scsi设备最多只能支持25米的有效距离)。采用网络存储为今后的远程数据备份和容灾(只需要解决网络带宽瓶颈)打下基础。建议采用hp storageworks nas 8000产品,保证系统的高可靠性、可扩展性和性能。4.2.7 安全设备建议使用netscreen 204百兆防火墙产品,内外各一台。其它安全系统如入侵检测、漏洞扫描、网页防篡改等为可选。4.2.8 防病毒对于windows系统而言,最严重的危害通常不是来自黑客,而是网络蠕虫病毒。因此需要一台服务器作为网络版防病毒中心。杀毒软件可选用诺顿、瑞星、
32、kill等网络版,需能够自动升级。4.2.9 原有服务器与置换服务器比较根 据实际应用需要和保留原油投资,把原来用于iflow发稿服务器ibm xseries 255作为软件下载和黄梅戏硬件平台;把用于iflow数据浪潮库服务器作为内容管理生成硬件平台,为了更清楚知道变动服务器的情况,下面给出原由的服务器与改动后的服务器列表比较清单:原有硬件列表一:型号 操作系统 配置 功能ibm rs6000-h80 aix4.3 内存:2g web 发布 apache 万博开发ibm rs6000-h80 aix4.3 内存:1g jsp开发的一些程序 resin 万博开发了娱乐频道的歌曲下载 自己开发了软件下载,黄梅戏 oracle 数据库机架式服务器 win2000 内存:1g asp万博开发ib
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1