还剩18页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
双活数据中心方案
一、需求背景伴随数据的大集中,银行纷纷建设了负责本行各业务处理的生产数据中心机房(一般称为数据中心),数据中心因其承担了全行业务,因此其并发业务负荷能力和不间断运行能力是评价一种数据中心成熟与否的关键性指标近年来,伴随网上银行、银行等多种互联网业务的迅猛发展,银行数据中心的业务压力业成倍增长,顾客对于业务访问质量的规定也越来越高,保障业务系统的7*24小时持续运行并提高顾客体验成为信息部门的首要职责商业银行信息系统的安全、稳定运行关系着国家金融安全和社会稳定,监管机构也十分重视商业银行的劫难备份体系建设,多次公布了商业银行信息系统劫难备份的有关原则和指导,对商业银行灾备系统建设提出了明确的规定为适应互联网业务的I迅速增长,保障银行各业务安全稳定日勺不间断运行,提高市场竞争力,同步符合监管机构的有关规定,建设灾备、双活甚至多活数据中心正在成为商业银行的共同选择
二、发展趋势:务单元的服务器,但优先调度当地服务器
2.实现方式1流量调度数据中心层面我们推荐使用两层逻辑算法的智能DNS调度方略,首先,全局负载设备会判断顾客的地理位置,将顾客调度到就近的数据中心,处理南北互访的I问题;另一方面,根据顾客所属运行商选择对应链路供顾客接入,处理跨运行商访问慢的问题此外,全局负载还可对客户端LDNS发起反向探测,判断顾客网络质量,为顾客选择最佳接入途径服务单元层面WEB、APP和DB服务单元都配置了当地负载均衡器,顾客访问流量抵达数据中心内部后,由服务单元的负载设备根据预设方略分发给各服务器,可根据顾客需求灵活选择轮询、优先级、最小连接等算法2业务持续性数据中心层面通过DC Cookie保证顾客接入同一数据中心顾客初次访问时,当地WEB负载设备在响应数据包中插入DC Cookie,当客户端网络发生变化时,第二次访问就也许被调度到其他数据中心,这时其他数据中心的WEB负载设备会识别该Cookie,将顾客祈求转发至第一次处理该顾客访问的I WEB负载设备,再由该负载设备进行调度服务单元层面WEB服务单元日勺负载提议通过cookie会话保持(插入、改写和被动)保证业务持续性;APP服务单元的负载可通过cookie或源IP会话保持保证业务持续性(与否需要会话保持,选择何种会话保持方式需要结合应用品体状况);DB服务单元一般不需要会话保持
(3)健康状态检查服务单元层面通过内置的应用级健康监视器对服务器进行积极探测,提供、S、RADIUS,FTP等常用模板对于其他应用,提供接口供顾客自定义检测内容和响应内容此外,还提供极具特色的被动健康检查功能,通过对TCP和协议日勺数据交互做采样分析,判断服务器日勺健康状态数据中心层面全局负载与服务侧的各区域负载均衡联动,实时共享信息,判断服务侧整体服务能力;同步全局负载设备会探测出口各链路健康状态,结合服务侧整体服务能力和设备自身负荷状况,综合判断该数据中心的健康状态(正常、繁忙、故障)
(4)故障切换服务单元层面服务单元内部某服务器繁忙或故障时,将顾客祈求调度到其他正常服务器数据中心层面a.某数据中心的WEB或APP服务器所有繁忙或所有故障时,顾客接入链路不切换,通过专线将数据转发至正常数据中心对应服务单元b.主数据中心的数据库服务器所有故障时,顾客接入链路不切换,通过专线将直接激活备数据中心的数据库,实现数据库一键切换数据库切换前需要验证数据库的对的性,顾客需要完毕数据验证并保证数据库按次序切换C.数据中心的所有链路同步故障时,全局负载设备将顾客流量平滑牵引至正常数据中心单链路故障时,可根据顾客需求切换至本中心其他链路或其他中心同ISP链路此外,当某数据中心出现服务能力局限性时链路繁忙、服务单元繁忙等,全局负载设备还可以基于数据中心的整体健康得分状况将顾客分流至其他数据中心,保障顾客正常访问5安全保障数据中心层面:a.网络出口处布署DDos防护设备并在运行商处购置流量清洗服务,保证数据中心整体安全b.网络出口处布署FW和IPS设备,从网络层和应用层保证数据中心不被恶意入侵c.全局负载设备提供DNS防火墙功能,充足保证DNS安全服务单元层面各服务单元布署防火墙,保证区域安全WEB服务单元直接面向互联网顾客,需要布署SSL卸载设备实现SSL加解密,提高业务访问安全同步,通过布署WAF保障WEB服务器的安全6业务优化加速a.跨数据中心的数据库同步需占用大量带宽资源,且数据量非常大,布署W0C设备可大幅压缩传播数据,削减流量WEB或APP服务单元跨数据中心通信时,通过W0C设备的协议优化和流缓存等技术实现加速当两者同步需要大量带宽资源时,优先保证数据库同步b.互联网区的IWEB服务单元直接面向公网,受公网网络质量影响较大,负载均衡可通过协议优化、数据压缩和智能加速等技术减少网络环境影响,提高顾客访问体验止匕外,外网顾客会有大量反复祈求,通过负载设备日勺高速缓存技术,对静态和内容进行缓存,减少服务器数据交互,减少服务器性能压力,提高访问速度7其他a.负载设备在服务单元内部通过旁路布署,为保证来回数据一致需要启动SNAT功能,一般状况下,WEB服务器都需要记录顾客访问源IP,可通过负载设备在头部插入X-Forwarded-for字段来透传顾客真实源IPb.数据中心网络出口对各类设备性能规定较高,针对某些老式防火墙性能局限性的状况,可以在防火墙前后各布署负载均衡设备,实现防火墙时负载c.考虑到极端状况,单数据中心需要能承载所有业务压力,提议选择2倍于实际性能需求日勺负载均衡设备负载均衡设备自身拥有过载保护机制,当CPU、内存等指标到达阀值时,向顾客发出告警信息,并重定向或丢弃后续新建连接
七、内网业务全局负载(以一级分行为例)
1.设计模型各分行数据中心与总行数据中心通过动态路由协议互联,形成大的企业内网环境其大多数业务(ATM、POS、签章、柜面等)通过IP地址直接访问,运用RHI路由注入日勺方式对外公布负载设备以M+N集群的方式分别布署在两个数据中心,不一样的业务系统由不一样的负载设备承载,处理了应用集中的风险问题,同步提供灵活日勺应用布署和无缝业务切换
2.实现方式
(1)流量调度以ATM业务为例,各分行数据中心对外公布的I业务访问IP相似,通过RHI路由注入的方式与OSPF实现联动,以COST的大小来判断访问日勺最优途径负载均衡设备以集群方式布署,单台设备与单个业务“静态绑定”,各设备间互为备份,宣布路由时基于详细业务系统进行宣布,可有效削减过多的路由条目,极大的简化运维工作如上图,数据中心对外公布4种业务,一般状况下,每台设备需要对外宣布4条路由,共16条路由,客户端最终访问的I途径由动态路由协议自身方略(根据COST值)决定而采用M+N方式的高可用集群,配合基于详细应用时IP-Anycast技术,每台设备承载一种重要业务,其他业务在该设备作为备份状态,设备对外宣布路由时,只宣布重要业务有关日勺路由,共4条,路由条目削减了75%2业务持续性内网业务比较特殊,客户端的位置和IP都相对固定不考虑故障状况,正常网络环境下,路由器根据COST判断访问途径时成果也相对固定,不存在同一客户端多次访问同一业务被调度到不一样负载的状况负载设备可根据访问的源IP做会话保持,保证祈求由同一服务器处理3健康状态检查服务器通过内置的应用级健康监视器对服务器进行积极探测,提供、S、RADIUS、FTP等常用模板对于其他应用,提供接口供顾客自定义检测内容和响应内容止匕外,还提供极具特色的被动健康检查功能,通过对TCP和协议的数据交互做采样分析,判断服务器的健康状态链路提供多种方式的链路健康检查,可指定探测地址和探测协议4故障切换服务器单台服务器故障时,负载设备将顾客祈求调度到其他正常服务器;当数据中心内某业务对应的所有服务器故障时,负载设备会删除为该业务宣布的路由,由其他负载设备接替其工作链路当链路发生故障时,远端路由器和负载设备都可以探测到故障状态,客户端访问业务系统时,路由器会选择正常链路转发数据负载设备当设备自身发生故障时,集群内其他设备会自动协商出一台设备接替其工作为保证风险可控,也可以提前设置接替次序,使切换尽量在数据中心内部完毕,减少未知风险多数据中心的建设需要投入大量资金,其项目周期往往很长,波及时范围也比较大从技术上来说,要实现真正意义上的双活,就规定网络、应用、数据库和存储都要双活就现阶段来看,大多数客户的多数据中心建设还达不到完全的双活规定,主流的建设目的是实现应用双活目前客户建设多数据中心的模型可以归纳为如下几种
1.I单纯的数据容灾正常状况下只有主数据中心投入运行,备数据中心处在待命状态发生劫难时,灾备数据中心可以短时间内恢复业务并投入运行,减轻劫难带来的损失这种模式只能处理业务持续性的需求,但顾客无法就近迅速接入灾备中心建设时投资巨大且运维成本高昂,正常状况下灾备中心不对外服务,资源运用率偏低,导致了巨大日勺挥霍
2.构建业务持续性:两个数据中心(同城/异地)的应用都处在活动状态,均有业务对外提供服务且互为备份但出于技术成熟度、成本等原因考虑,数据库采用主备方式布署,数据库读写操作都在主中心进行,灾备中心进行数据同步发生劫难时,数据中心间H勺数据库可以迅速切换,防止业务中断双活数据中心可充足盘活企业闲置资源,保证业务的持续性,协助顾客接入最优节点,提高顾客访问体验
3.提高业务服务能力多种数据中心同步对外提供服务且互为备份,各中心的数据库可同步处理应用时读写祈求,网络、存储、应用和数据库所有实现多活各数据中心独立运行,顾客流量可被智能调度,形成灵活、弹性和可扩展的面向服务日勺业务架构
三、业务目的顾客建设多数据中心的思绪和建设模型略有不一样,但大多数顾客的重要建设目时可以归纳为如下几点流量分发顾客访问流量可灵活、弹性的I调度到多种数据中心,使各数据中心压力相对均衡,保证顾客接入近来最迅速的数据中心节点,提高顾客访问体验故障切换当出口链路或内部服务器出现异常时,运维人员可第一时间获悉故障状况,业务可根据需要自动或手动平滑切换至正常节点,保证顾客访问的持续性业务安全数据中心所处位置基础设施完善,水电通信供应稳定,数据中心内部有对应技术手段保证整个数据中心抵御DDos袭击,各业务系统不被黑客非法入侵环境一致性多种数据中心对顾客来说理应是透明日勺,其对外服务时提供统一接口,各数据中心内部数据和服务能力需要完全一致,且随时处在可切换状态
四、实现逻辑我们把整个数据中心在逻辑上分为接入层和服务层,其处理逻辑日勺示意图如下DNS)接入层(智能(RHI接入层路由注入)服务层故障切换
五、总体设计总行数据中心整体上分为主中心和灾备中心,两者的I网络架构、业务系统和服务能力都基本相似,同步对外提供服务,形成双活数据中心数据中心内部划分为互联网业务区(提供外网服务,如银行、网上银行等)、关键生产业务区(老式生产业务,如ATM柜面等)、数据库区(生产/查询)和业务测试区,出于成本考虑,灾备数据中心不设业务测试区主备数据中心和各一级分行之间通过专线互联,运用动态路由协议组建企业内部专网数据中心的对外业务集中在互联网业务区,一般使用域名方式对外公布,客户端访问业务系统时,需要先由DNS将域名解析为IP地址,然后再访问该目的IPo对外业务的全局负载一般运用DNS解析实现,其可根据顾客地理位置、顾客所属运行商和网络质量、数据中心服务能力等原因作为判断根据,为不一样顾客返回不一样日勺IP地址,实现流量的合理分派对于数据中心的内网业务,一部分与外网业务相似,通过域名公布另一部分与一级分行业务类似,直接通过IP地址访问对于通过IP地址访问的业务,内网全局负载采用IP-Anycast(RHI路由注入)技术实现,其原理是在各数据中心以相似IP公布业务,由动态路由协议根据COST值等参数顾客判断访问的最佳途径
六、互联网业务全局负载(以网银为例)
1.设计模型我们把网银业务从逻辑上分为接入侧和服务侧,接入侧包括出口链路、全局负载设备;服务侧包括WEB服务单元、APP服务单元和DB服务单元WEB服务单元包括SSL卸载设备、WAF防火墙、负载均衡和服务器;APP服务单元包括防火墙、负载均衡和服务器;DB服务单元包括防火墙、负载均衡、数据库审计和数据库WEB服务单元和APP服务单元在2个数据中心同步提供服务,实现应用双活考虑到数据强一致性、技术成熟度和成本等原因,双数据中心间的DB服务单元提议主备布署,数据中心内部的数据库集群可结合当地负载均衡实现多活为到达最佳负载效果,需要各服务单元日勺负载设备可以访问其他数据中心对应服。
个人认证
优秀文档
获得点赞 0