论系统可靠性设计
摘要:随着计算机网络应用的逐步普及和深入,业务处理越来越依赖于计算机网络系统,网络的可靠性必然是建立网络系统首要考虑的问题之一,否则网络故障会造成巨大的经济损失和社会影响。本人有幸作为项目负责人之一参与了某大学二期网络的建设,并负责了校园网络可靠性的设计和实施。该校园网主要分为行政办公大楼,教学楼群,实验楼群,图书馆,信息中心和网络中心机房6个主要区域。本文主要从电缆级别,通信线路,服务器,网络管理,网络中心系统等方面介绍如何建立高可靠性的应用网络系统,以满足实际需求。
正文:
随着计算机网络应用的逐步普及和深入,业务处理越来越依赖于计算机网络系统,网络的可靠性必然是建立网络系统首要考虑的问题之一,否则网络故障的产生会造成巨大的经济损失和社会影响。2007年7月到2008年7月,作为××公司的一名技术骨干,本人参与了××大学二期网络的建设,全程参与了整个网络可靠性的规划设实施,以下是项目在可靠性方面所采取的方案。
第一级容错,网络电缆。无论是光纤,同轴电缆,双绞线还是组合布线,都可能出现各种
各样的故障。首先由于选用的电缆电气指标达不到要求,造成信号衰减过度,引起网络故障;其二,电缆接插头虚接,松落;其三电缆线受到外界老化,朽蚀,机械等原因损坏。若损坏的电缆只是连接在一个独立的设备,则定位和修复容易,而如果是连接多个网络设备的电缆线路或主干电缆线路损坏,则很难定位及修复。本方案在主干线路和其他重要支路上布置双线甚至多线,当主线断路时,自动切换到辅线工作。为了考虑降低电缆线路同时损坏的可能,电缆布置在不同的路途上。(250)
第二级容错,冗余拓扑。首先,本方案采用了三层的网络拓扑结构,并在分布层和核心
层的交换机之间使用冗余路径,防止网络因单点故障而无法运行,以此提升网络拓扑的可靠性。然而,对网络中的交换机和路由器添加多余路径会在网络中引入需要动态管理的通信环路,处理不当将产生不必要的广播风暴,造成网络瘫痪。所以必须启用生成树协议STP。STP 会特地阻塞可能导致环路的冗余路径,以确保网络中所有目的地之间只有一条逻辑路径。一旦网络出现故障,STP会重新计算路径,将必要的端口解除阻塞,使冗余路径进入活动状态。其次,采用端口聚合技术。端口聚合可将多物理连接当成一个单一的逻辑连接来处理。它允许两个交换器之间通过多个端口并行连接同时传输数据以提供更高的带宽,更大的吞吐量和可恢复性技术。一般来说,两个普通的连接器连接的最大带宽取决于媒介的传输速度(比如100BAST-TX为200M),而是用Trunk技术可以将4个200M的端口捆绑后成为一个高达800M的连接。这一技术的优点是以较低的成本通过捆绑多端口提高带宽,从而消除网络访问中的瓶颈。另外,Trunk还具有自动带宽平衡,即使Trunk只有一个连接存在时,仍然会工作,提供了网络的可靠性。(520)
第三级容错,设备冗余。
首先,该网络采用了双核心拓扑结构。核心层采用两台CISCO C6500交换机,两者之间使用双千兆光纤互联,利用链路聚合技术,在两台核心交换机之间扩大通信吞吐量,提高可靠性,实现复杂均衡的冗余连接。当一条交换机出现故障或核心交换机与汇聚层交换机之间的某条链路出现故障,系统会自动将通信业务快速切换到另一台正常的交换机上,从而实现系统的可靠性。(170)
其次,DNS服务器冗余配置。该校园网里有自己的DNS服务器,服务器采用两台,一台主DNS服务器,一台辅助DNS服务器。这样可以实现DNS服务器的容错,也就是当一天DNS
坏掉,我们可以使用另一台实现域名解析,还可以实现负载均衡,也就是把所有的DNS请求由两台DNS服务器来解析,可以减轻主服务器的负担。
第四、Web和FTP服务器的集群。由于网络用户的增加,网络成
为了宣传的好工具。许多高校都有自己的Web站点,用于宣传学校和发布招聘,招生等信息。有些高校也有了网络教学系统,向外部开发FTP资源服务。单台服务器显然无法满足网络用户剧增的需求。该学校采用了四台Linux Cluster 服务器,作为Web和FTP服务器,然后利用DNS服务器配置,将不同的服务请求连接定向到不同的服务器上,从而实现服务器的负载均衡。而且当其中某台服务器出现故障,请求连接将定向到其他正常工作的服务器上。从而实现服务器的高可靠性,保证服务的质量。
第五、冗余电源的设置。在一些重要的设备,核心交换机,路由器,防火墙,入侵检测系统,数据库服务器,Web和FTP服务器上设置冗余电源,当其中一个电源出现故障时,备份电源可以立刻接管主要的电源的工作,而当替换了故障电源后,两者又可以一起工作,实现负载均衡。
第四级冗余。冗余网关配置。为了减少交换机故障的影响,交换机上使用了STP技术。
同样,作为网关的路由器上同样可以使用冗余网关技术。目前有三种冗余网关技术。国际上的标准VRRP(虚拟路由冗余协议),允许在不同厂商设备之间运行,然而只有主服务器处于活动状态,而备份服务器处于热备闲置状态,导致的资源的利用率不高。CISCO的专有标准HSRP(热备份路由协议),同样可以实现冗余网关,但是和VRRP一样存在服务器热备闲置问题,但是可以通过配置多个虚拟路由器组从而实现负载均衡。第三种,CISCO的网关负载均衡协议(GLBP),GLBP不但可以实现冗余网关,而且可以实现负载均衡。由于该学校的路由设备大部分采用了CISCO的设备,所以,冗余网关协议采用CISCO专有的协议GLBP,将三台路由器的虚拟网关IP配置为一样,并且通过设置优先级使其中一台路由器成为主服务器,另外两台为备份服务器,但是三台服务器都处于活动状态。
第五级可靠性设置。分布式数据库。由于该学校有两个校区,并且开展了提供了网络教学,所以在不同校区布置了ORACLE数据库,并且每个校区的的重要数据库(比如学生档案,学生考试信息,招生
信息等)进行了双机备份,并存储与不同的位置,预防一些难于预测的灾难。
第六级容错,采用网络管理软件系统进行网络的监视和控制,随时了解网络的运行情况,
诊断和确定网络故障的可能种类,发生点,作用范围等,可以作为网络维护人员的得力助手,以便及时查出故障和进行故障排除。网管系统在大中型网络系统中是必不可少的网络工具,可以大大缩小排除网络故障的时间和降低网络维护成本。
本项目自2008年7月完工以来,运行良好,系统的安全性,高可靠性得到了学校领导和广大师生的好评。我觉得不足之处有以下几点:
DNS服务采用了循环机制,虽然实现了冗余功能,但是不能对不同DNS服务器的性能,负载实现均衡。而且,如果某台DNS服务器出现故障,可能导致某些用户连接失败而无法得到服务。
第二,网络采用了RIP路由协议,路径的均衡采用跳步数,不能充分考虑网络带宽和延迟,本人建议,以后应该改用EIGRP或者OSPF协议,动态的实现负载均衡。
数据容灾与备份 摘要
摘要:随着计算机网络应用的深入,教育也步入了信息化。很多高校拥有属于自己的网络系统。并且随着信息发布平台,邮件系统,协同办公,校园一卡通等服务的深入应用,越来越多有价值的信息转变为海量数据,数据的价值也越来越高,任何数据的丢失都会给学校带来极大的损失。如何保障数据的安全,以及数据在灾难之后的恢复成为了高校信息系统的重要任务之一。本人作为项目负责人之一参与了××高校的信息网络建设,本文介绍本信息系统的数据容灾与备份方案。
开头略
灾难分析:建立容灾备份工程最重要的一步是灾难分析,只有对灾难进行正确的分析后才能设计出一个好的备份方案。建立容灾备份工程的最终目的是保证在灾难造成对数据的破坏后,业务数据的可恢
复性。灾难可以分为自然灾难,社会灾难和人为灾难。自然灾难包括或者,水灾,地震等突发自然灾害照常业务系统灾难。社会灾难包括区域性电力系统故障,恐怖分子制造的爆炸,战争引起的定点破坏等灾难。国内外社会不安定因素的存在,必须引起企业足够的忧患意识。美国9.11就是一个很好的例子,一些没有任何容灾措施的企业由于核心业务数据的破坏而最终破产。认为灾难包括IT系统管理人员的误操作,来自网络的恶意攻击,计算机病毒发作造成数据灾难。本文主要从备份中心,磁盘阵列,双击容错和集群,磁盘镜像,数据防毒等方面来介绍本项目的数据容灾方案。
(
数据备份更多的是指数据从在线状态剥离到离线状态的过程,终于服务器高可用集群技术已经远程容灾技术有着本质区别。虽然从目的上讲,这些技术都是为了消除或减轻意外事件给系统带来的影响,但是由于其侧重的方向不同,实现的手段和产生的效果也不尽相同。集群和容灾技术的目的是为了保证系统的可用性,也就是说当一位发生时,系统所提供的服务和功能不会因此而间断。对数据而言集群和容灾技术是保护系统的在线状态,保证数据可以随时被访问。而备份技术则是将整个系统的数据或状态保存下来,以挽回硬件设备损坏带来的损失,还有逻辑错误和任务恶意拨号带来的损失。备份技术指保证数据可以恢复,但是恢复需要一定的时间。(备份与容灾的区别---可不写)
数据容灾就是防止数据失效,有多种途径:如加强建筑物安全措施,提供员工操作水平,购买优良设备。但是最根本的方法还是建立完善的备份知道。备份就是保留一套后备系统。这套后备系统与现有系统一模一样,或者是能够替代现有系统的功能。
组建远程备份中心:远程备份是为了防止主计算机中心和备份中西因为距离太近而同
时损坏。
1.备份中心的选址:备份中心选址时应该考虑的问题有:备份中心与计算机中心应
有充分元的距离;网络基础设施较完备,备份中心要有足够的带宽确保与数据中心的数据同步;不能在地震,洪涝,台风,雷击等地质灾害和天气灾害多发地区;
不能在重要设施密集的地区,不能在交通要道附近;还得考虑是否有充足的双回路电流保障。低价等成本也是一个不容忽视的考虑因素。首先该学校的主计算机中心位于东校区,而数据备份中心位于离东校区20千米外的西校区。西校区在交通,低价和电力设施方面都有很多优势。
2.备份网络的技术:学校存有关键业务主机的服务器都是基于SAN(Storage area network,
存储局域网)网络,而其他非关键主机则居于Lan网络。首先,在计算机中心安装客户端备份软件,管理需要备份的服务。在备份中心安装服务器端备份软件,用来管理备份
服务器。在该系统中,SAN网络中关键业务主机数据通过备份服务器的管理软件将数据分别存储到位于异地的2个磁带库中。该架构能够解决主机故障(包括硬件和系统等软件故障),核心数据库丢失故障等任何硬件级别的单点故障,并能准备地依靠备份数据将系统怀远到最后一次备份前的任意时刻,实现了逻辑损坏的修复功能。备份频率也是一个值得考虑的问题,因为如果备份时间短,比如每次计算机中心业务活动产生对数据的修改都将其数据备份至备份中心,那么一旦系统发生故障,丢失的只是最后一次业务活动产生的数据。而这对备份中心线路容量,备份中心服务的性能要求很高。
3.主机中心与备份中心之间的线缆与线路选择。无论是光纤,同轴电缆,双绞线还是组合
布线,都可能出现各种各样的故障。首先由于选用的电缆电气指标达不到要求,造成信号衰减过度,引起数据丢失;其二,电缆接插头虚接,松落;其三电缆线受到外界老化,朽蚀,机械等原因损坏。若损坏的电缆只是连接在一个独立的设备,则定位和修复容易,而如果是连接多个网络设备的电缆线路或主干电缆线路损坏,则很难定位及修复。本方案在主干线路和其他重要支路上布置双线甚至多线,当
主线断路时,自动切换到辅线工作。为了考虑降低电缆线路同时损坏的可能,电缆布置在不同的路途上。这样可以保证数据的备份不会应为线缆的问题而受到影响。
4.备份中心入侵检测设置:由于备份中心的数据和主机房的数据一样重要,都是网络的核
心数据。难免存在网络黑客进行信息窃取,信息破坏,这种数据灾难给企业或学校带来的损失不亚于天气灾害,地质灾害对数据造成的影响。本方案采用入侵检测系统来保证备份中心的数据安全。入侵检测系统是一种积极主动的安全防护工具,提供了对内部攻击,外部攻击和误操作的实时防护,在计算机网络和系统受到危害之前进行报警,拦截和响应。该备份中心的入侵检测系统采用Kill入侵检测系统来保证备份中心的数据。Kill 是一款基于会话的网络入侵检测系统。系统综合使用了模式匹配,协议分析,异常检测,重点监视,内容回放,网络审计等入侵分析与检测技术,
磁盘阵列技术
磁盘阵列技术也称RAID(Redundant Array of Independent Disk 独立冗余磁盘阵列),该技术可以在一定程度上改善硬盘系统的可靠性与可用性。简单的磁盘阵列可以采用在服务器中加装RAID卡和多个硬盘来实现,更好的办法是采用专用的磁盘阵列柜。
(2)双机容错和集群
双机容错技术也成为双机热备份技术,是国内对于上级容错相关技术的俗称。他的基本原理是在同一个计算机应用软件系统上采用两个或两个以上的主机/服务器硬件系统来支持。这样,当主要的主机/服务器发生故障时,就通过相应的技术,由另外的主机/服务器自动接管故障机所承担的任务。
集群技术是使用特定的连接技术,来将许多计算机设备集合起来,从而提供与超级计算机性能相当的并行处理技术。
(3)磁盘镜像
磁盘镜像是指在一个磁盘控制器上挂接两个同样的物理硬盘,一个为主盘,另一个为镜像盘,数据可以同时写到两个硬盘中,两个硬
盘在工作中完全保持相同的状态,这样,在一个硬盘发生故障时,另一个就能保证系统正常工作,但是,这种方法在磁盘控制器发生故障时,系统仍无法正常工作。、
数据防毒:病毒的感染,入侵也会对数据造成一定的损失。所以部署杀毒软件使数据免于病毒灾难也是非常重要的。在该网络防病毒方案中,我们首先在学校的网络中心配置一台高效的Window2000服务器安装一个杀毒软件网络版的系统中心,负责管理多个主机网点的计算机。在各行政楼,教学单位等客户端计算机安装杀毒软件网络版的客户端。安装完杀毒软件
网络版后,在管理员控制台对我拿过来中所以客户端进行定时杀毒的设置,保证所以客户端技术在没有联网的时候也能够定时对本机进行查杀毒。网络中心负责整个校园网的升级工作。为了安全和管理的方便起见,有网络中心的系统中心定期的,自动地到杀毒软件厂家网站上获取最新的升级文件,然后自动将最新的升级文件分发到其他主机网点的客户端与与服务器端,并自动对杀毒软件网络版进行更新。采取这种升级方式,一方面确保校园网内的杀毒软件的更新保持同步,使整个校园网都具有最强的防毒能力;另一方面,由于整个网络的升级,更新都是由程序来自动智能的完成,就可以避免由于认为因素造成网络中因为没有及时升级病毒库和扫描引擎而失去最强的防病毒能力。
数据加密:对一些机密数据进行加密可以减少人为因素造成的数据灾难。
由于高校保存着一些非常敏感的信息,像学生的档案信息,学校的招生信息,学生的成绩等重要信息。为了防止非授权的人对这些信息进行恶意窃取访问,所以信息的加密,信息的授权访问显得特别重要。首先对学校一些异常机密信息进行加密变换,就算有人获取了这些信息由于信息已经是经过变换,所以也无法真正得到。加密可以采用对称加密或非对称加密。对称加密的效率远远高于非对称加密,对于一些不必要在网络上传输的机密数据,可以采用3DES对数据库中的数据进行加密。而对于需要在网络上传输的数据,可以采用对称和非
对称相互结合的机密方式,会话密钥采用公钥加密体制进行加密,而数据采用私钥体制进行加密,既保证的数据安全性,又提高了数据的加密效率。
冗余电源,机器突然断电会造成正在运行的业务数据的丢失,所以配备冗余电源也是至关重要的(扩展)
感觉字数不够写防毒软件。
因篇幅问题不能全部显示,请点此查看更多更全内容