浅谈NetBackup与Simpana

2019-09-25 15:05:09 阅读量:


随着大型计算、海量存储不断发展,存储系统在企业信息系统中的位置越来越重要,其性能直接影响上层业务主机的工作效率,其稳定性很大程度上决定了应用系统的稳定性和持续性,其安全可靠性关系到数据的完整性,而数据的完整性往往决定了应用系统能否正常工作。数据备份技术是指在数据中心内,为了防止操作失误、病毒、人为破坏、软件缺陷、升级故障等导致的数据永久性丢失,而将应用系统中的数据从应用主机所用存储设备复制到其它存储设备的过程。
 
备份软件是备份系统的核心,主要功能是管理备份策略,监控备份作业,支配备份介质。Symantec的NetBackup软件、CommVault公司的Simpana软件是常见的备份软件,那么两者在工作原理和实现机制上有何区别呢?

 1、NetBackup简介  
 
NetBackup备份软件主要由管理服务器软件模块(Master Server)、介质服务器软件模块(Media Server)、客户端代理软件模块(Client)构成。在NetBackup备份平台上,Master Server软件模块负责对备份系统进行系统管理,提供备份策略、备份任务以及数据恢复的配置界面和过程监控。Media Server软件模块负责介质设备的管理,和介质设备通信、读写管理,是备份服务器和介质的中间件。客户端代理软件模块(Client)负责和Master server通信交换信息。
 
\
图2 NetBackup备份软件架构
 
如图1所示是一个完整的备份系统,包括一台安装了Master Server的备份管理服务器、一台安装了Media Server的介质服务器、一台备份存储设备和四台安装了客户端代理(Client)的业务主机。假设某时刻,备份系统需要协同完成一个备份任务,其工作流程大致如下:
 
1、备份管理服务器(Master Server)发起备份任务,如“介质服务器备份客户端文件服务器上C盘的数据”;
2、介质服务器(Media Server)收到任务后,检查备份介质是否正常并准备好存储空间,向文件服务器发(Client)起就位通知,请求传输备份数据;
3、文件服务器(Client)收到就位信息,通过前端业务网络或者后端存储网络将所需备份的数据发送给介质服务器(Media Server);
4、介质服务器(Media Server)将接收到的数据写入备份介质中,向管理服务器(Master Server)返回备份成功和数据索引的信息,如果备份失败则直接返回备份失败信息。
 
 2.Simpana简介  
 
Simpana备份软件主要由管理服务器软件模块(CommServe,简称CS)、介质代理软件模块(MediaAgent,简称MA)、客户端代理软件模块(iDataAgent,简称iDA)构成。
 
\
图2 Simpana备份软件架构
 
同样的,图2所示是一个完整的备份系统中,CS软件模块安装在备份管理服务器上,提供全网的管理控制台,负责安全管理、工作流管理、策略管理等。MA软件模块安装在介质服务器上,负责掌管备份介质。iDA软件模块安装在客户端上,通过网络与CS、MA通信交互或传输备份数据。备份任务在CS的控制下,iDA从客户端将数据读出,并且传送到MA介质服务器上,最后通过MA写到具体的备份介质中,工作流程大致如下:
 
1、某个时刻,备份管理服务器(CS)发起备份通知,确认介质服务器(MA)和文件服务器(iDA)就位;
2、备份管理服务器(CS)下发备份任务,如“介质服务器备份客户端文件服务器上C盘的数据”;
3、文件服务器(iDA)收到备份任务,确定备份内容生成备份任务列表,并通过网络将备份列表和数据发送给介质服务器(MA);
4、介质服务器(MA)收到备份任务列表后将其整合生成索引信息,并将索引信息与数据写入备份介质中;
5、备份数据成功存储后,介质服务器(MA)向管理服务器(CS)返回备份成功,如果备份失败则直接返回备份失败信息;
6、备份管理服务器(CS)收到备份成功信号后,将更新本地存放的部分索引信息。
 
 
 3.NetBackup与Simpana的主要区别  
 
利用Simpana软件与NetBackup软件进行数据备份时,除了备份过程中各个软件模块之间的交互机制有所差异,其最大的区别还在于数据的索引方式。我们先了解一下什么是索引信息?不难理解的是,无论数据备份还是归档,都会产生数据索引,记录着文件名称、大小、存放地址、保留时长等信息,即索引信息,以方便后续数据恢复时进行定位索引,准确快速寻找到所需恢复的数据对象。
NetBackup采用传统的集中式索引方式,将所有索引数据存放在备份管理服务器上,这种索引方式的优势主要体现在实现简单、管理方便。然而在大数据时代,海量数据必将产生巨大的索引信息,这种索引方式的弊端便慢慢暴露出来了:
 
1、负责存放索引信息和数据检索的备份管理服务器将会成为整个备份系统的性能瓶颈;
2、大量索引信息也需要备份,导致总体备份时间过长,影响生产系统业务运作;
3、索引信息集中式存放,发生故障时重建耗时长,且索引信息重建过程备份系统将无法正常进行备份或恢复。
 
Simpana采用的是分布式索引方式,即数据采用分级索引的方式进行检索定位,一级索引记录数据备份的完成情况及其所属的MA信息,数据恢复时用来确定所需恢复数据的副本是否存在并定位管理该备份数据的MA;二级索引用来记录每个数据对象的信息和具体存放位置,索引信息量较大。一级索引的数据量很少,存放于备份管理服务器上,二级索引信息量较大,和备份数据一起存放于备份介质上,由介质服务器管理。分布式索引技术的应用,有效地避免了集中式索引方式存在的性能瓶颈问题,使得Simpana备份平台能满足大数据时代海量数据管理的需求。