了解什么是Raid?Raid的作用是什么?

1.什么是Raid:
Raid全称(Redundant Array of inexpensive Disks廉价磁盘冗余阵列),而在我们的现实生活之中我们会发现磁盘并不廉价,所以我们现在也称之为独立磁盘冗余阵列简单的理解就是将多块硬盘做一个组合来进行使用。
2.Raid的定义:
多个独立的物理硬盘按照不同的方式组合起来形成一块虚拟磁盘。实际生活中我们看到的是两块及两块以上的一个聚合。一般在工作环境中一个磁盘阵列的连接也是至少有两根线的,这样可以实现多路径,提高传输速率。
3.磁盘阵列:
磁盘阵列的样式有三种,一是外接式磁盘阵列柜、二是内接式磁盘阵列卡、三是利用软件来进行仿真
1)外接式磁盘阵列柜最常被使用大型服务器上,具可热交换(Hot Swap)的特性,不过这类产品的价格都很贵。
了解什么是Raid?Raid的作用是什么?
2)内接式磁盘阵列卡,因为价格便宜,但需要较高的安装技术,适合技术人员使用操作。硬件阵列能够提供在线扩容、动态修改阵列级别、自动数据恢复、驱动器漫游、超高速缓冲等功能。它能提供性能、数据保护、可靠性、可用性和可管理性的解决方案。阵列卡专用的处理单元来进行操作。
了解什么是Raid?Raid的作用是什么?
3)利用软件仿真的方式,是指通过网络操作系统自身提供的磁盘管理功能将连接的普通SCSI卡上的多块硬盘配置成逻辑盘,组成阵列。软件阵列可以提供数据冗余功能,但是磁盘子系统的性能会有所降低,有的降低幅度还比较大,达30%左右。因此会拖累机器的速度,不适合大数据流量的服务器。
磁盘阵列还能利用同位检查(Parity Check)的观念,在数组中任意一个硬盘故障时,仍可读出数据,在数据重构时,将数据经计算后重新置入新硬盘中。
4.Raid的优势:
1)容量和管理方式上的优势:
易于灵活的进行容量扩展,’虚拟化’使管理性极大的增强。
2)性能上的优势:
磁盘分块技术,带来性能的提高。
3)Raid的可靠性和可用性:
通过冗余技术和热备、热换提升了可靠性。
5.Raid根据磁盘的不同组合方式形成不同的级别,但是我们必须要清楚Raid的级别没有好与坏之分,并不是说级别越高越好,只是组合方式不同性能不同选择方式也不同。

Raid技术主要包含Raid 0~Raid 50等数个级别,它们的侧重点各不相同,常见的级别有0 1 2 3 4 5 6 7 (及10、01、50等组合级别)。
Raid 0:条带技术,以条带的形式将数据均匀的分布在阵列上的各个磁盘之上。Raid 0连续以位或字节为单位分割数据,并行读/写于多个磁盘上,因此具有很高的数据传输率,但它没有数据冗余,因此并不能算是真正的RAID结构。RAID 0只是单纯地提高性能,并没有为数据的可靠性提供保证,而且其中的一个磁盘失效将影响到所有数据。因此,RAID 0不能应用于数据安全性要求高的场合。
了解什么是Raid?Raid的作用是什么?
Raid 0所需成员磁盘数:2个及2个以上;
优 点:极高的读写效率,2倍;不存在校验、不会占用太多的CPU;设计、使用和配置比较简单;
缺 点:不冗余,出现问题数据难恢复;
适用领域:视频生成和编辑、图像编辑等对大的传输带宽操作;
出现问题最多允许坏0块磁盘。

Raid 1:通过磁盘数据镜像实现数据冗余,在成对的独立磁盘上产生互为备份的数据。当原始数据繁忙时,可直接从镜像拷贝中读取数据,因此RAID 1可以提高读取性能。RAID 1是磁盘阵列中单位成本最高的,但提供了很高的数据安全性和可用性。当一个磁盘失效时,系统可以自动切换到镜像磁盘上读写,而不需要重组失效的数据。
了解什么是Raid?Raid的作用是什么?
Raid 1所需成员磁盘数:2N个(N>=1),最低需要2个;
优 点: 具有100%的数据冗余,提供最高的数据安全保障,理论上可以实现2倍的读取效率,设计和使用也比较简单;
缺 点: 开销大,磁盘空间的利用率只有50%,在写操作方面性能并没有提升,如上图所示,我们可以清楚的看到相同的数据要写入到两个磁盘中去;
适用领域: 财务、金融等高可用、高安全的数据存储环境;
出现问题最多允许坏1块磁盘。

Raid 2:是Raid 0的改良版,以汉明码(Hamming Code)的方式将数据进行编码后分割为独立的位元,并将数据分别写入到硬盘中。因为在数据中加入了错误修正码(ECC,Error Correction Code),所以数据整体的容量会比原始数据大一些。Raid 2是为大型机和超级计算机开发的带汉明码校验磁盘阵列。它是将数据条带化地分布于不同的硬盘上,条块单位为位或者字节,并使用“加重平均纠错码”的编码技术来提供错误检查及恢复,这种纠错码也被称为“海明码”。海明码需要多个磁盘存放检查及恢复信息,使得RAID2技术实施更复杂,因此在商业环境中很少使用。
在写入时,RAID 2在写入数据位同时还要计算出它们的汉明码并写入校验阵列,读取时也要对数据即时地进行校验,最后再发向系统。汉明码只能纠正一个位的错误,所以RAID 2也只能允许一个硬盘出问题,如果两个或以上的硬盘出问题,RAID 2的数据就将受到破坏。但由于数据是以位为单位并行传输,所以传输率也相当快。
Raid 3: 带奇偶验证码的并行传送,Raid 3是把数据分成多个“块”,按照一定的容错算法,存放在N+1个硬盘上,实际数据占用的有效空间为N个硬盘的空间总和,而第N+1个硬盘上存储的数据是校验容错信息,当这N+1个硬盘中的其中一个硬盘出现故障时,从其它N个硬盘中的数据也可以恢复原始数据,这样,仅使用这N个硬盘也可以带伤继续工作(如采集和回放素材),当更换一个新硬盘后,系统可以重新恢复完整的校验容错信息。由于在一个硬盘阵列中,多于一个硬盘同时出现故障率的几率很小,所以一般情况下,使用RAID3,安全性是可以得到保障的。
Raid3同Raid 2非常类似,都是将数据条块化分布存储于不同的硬盘之上,区别在于Raid 3使用简单的奇偶校验算法,并用单块磁盘存放奇偶校验信息。如果一块磁盘失效,奇偶盘及其他数据盘可以重新产生数据;如果奇偶盘失效则不影响数据使用。Raid 3对于大量的连续数据可提供很好的传输率,但对于随机数据来说,奇偶盘会成为写操作的瓶颈。Raid 3是在Raid 2基础上发展而来的,主要的变化是用相对简单的异或逻辑运算(XOR,eXclusive OR)校验代替了相对复杂的汉明码校验,从而也大幅降低了成本。
了解什么是Raid?Raid的作用是什么?
优 点: 具有100%的数据冗余,提供最高的数据安全保障,理论上可以实现2倍的读取效率,设计和使用也比较简单;
缺 点: 开销大,磁盘空间的利用率只有50%,在写操作方面性能并没有提升,如上图所示,我们可以清楚的看到相同的数据要写入到两个磁盘中去;
适用领域: 财务、金融等高可用、高安全的数据存储环境;
出现问题最多允许坏1块磁盘。

Raid 4: 同样也将数据条块化并分布存储于不同的磁盘上, 但Raid 4是按数据块为单位存储的,那么数据块应该怎么理解呢?简单的话,一个数据块是一个完整的数据集合,比如一个文件就是一个典型的数据块。当然,对于硬盘的读取,一个数据块并不是一个文件,而是由操作系统所决定的,这就是我们熟悉的簇(Cluster)。RAID 4这样按块存储可以保证块的完整,不受因分条带存储在其他硬盘上而可能产生的不利影响(比如当其他多个硬盘损坏时,数据就完了)。不过,在不同硬盘上的同级数据块也都通过XOR进行校验,结果保存在单独的校验盘中。
了解什么是Raid?Raid的作用是什么?
Raid 4所需成员磁盘数:3块或3块以上;
优 点: 冗余,读写速度2倍;
缺 点: 坏盘时另外2块需要重新计算还原坏盘数据,校验码盘压力大成为瓶颈;
出现问题最多允许坏1/3块磁盘。

Raid 5: 也被叫做带分布式奇偶位的条带,与Raid 4类似,但是不单独指定的奇偶盘,而是在所有磁盘上交叉地存取数据及奇偶校验信息。在Raid 5上,读/写指针可同时对阵列设备进行操作,提供了更高的数据流量,Raid 5更适合于小数据块和随机读写的数据。Raid 5与Raid 3相比,RAID 5把奇偶位信息也分布在所有的磁盘上,而并非一个磁盘上,大大减轻了奇偶校验盘的负担。尽管有一些容量上的损失,RAID 5却能提供较为完美的整体性能,因而也是被广泛应用的一种磁盘阵列方案。它适合于输入/输出密集、高读/写比率的应用程序,如事务处理等。为了具有RAID 5级的冗余度,我们需要至少三个磁盘组成的磁盘阵列。RAID 5可以通过磁盘阵列控制器硬件实现,也可以通过某些网络操作系统软件实现。
了解什么是Raid?Raid的作用是什么?
RAID 5 是一种存储性能、数据安全和存储成本兼顾的存储解决方案,目前使用最多的磁盘阵列。 以4个硬盘组成的RAID 5为例,其数据存储方式如图所示,我们来进行分析:
了解什么是Raid?Raid的作用是什么?
如上图所示,P3为D9,D10和D11的奇偶校验信息,其它以此类推。 RAID 5不对存储的数据进行备份,而是把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。当RAID5的一个磁盘数据发生损坏后,利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。
RAID 5可以理解为是RAID 0和RAID 1的折衷方案。RAID 5可以为系统提供数据安全保障,但保障程度要比Mirror低而磁盘空间利用率要比Mirror高。RAID 5具有和RAID 0相近似的数据读取速度,只是多了一个奇偶校验信息,写入数据的速度比对单个磁盘进行写入操作稍慢。同时由于多个数据对应一个奇偶校验信息,RAID 5的磁盘空间利用率要比RAID 1高,存储成本相对较低。
Raid 5所需成员磁盘数:3块或3块以上;
优 点: 冗余,读写速度2倍;
缺 点: 坏盘时另外2块需要重新计算还原坏盘数据;
出现问题最多允许坏1/3块磁盘。

Raid 6: 是由一些大型企业提出来的私有RAID级别标准,它的全称叫“Independent Data disks with two independent distributed parity schemes(带有两个独立分布式校验方案的独立数据磁盘)”。这种RAID级别是在RAID 5的基础上发展而成,因此它的工作模式与RAID 5有异曲同工之妙,不同的是RAID 5将校验码写入到一个驱动器里面,而RAID 6将校验码写入到两个驱动器里面,这样就增强了磁盘的容错能力,同时RAID 6阵列中允许出现故障的磁盘也就达到了两个,但相应的阵列磁盘数量最少也要4个。
与RAID 5相比,RAID 6虽然增加了第二个独立的奇偶校验信息块,两个独立的奇偶系统使用不同的算法,数据的可靠性非常高,即使两块磁盘同时失效也不会影响数据的使用。但RAID 6需要分配给奇偶校验信息更大的磁盘空间,相对于RAID 5有更大的“写损失”,因此“写性能”非常差。较差的性能和复杂的实施方式使得RAID 6很少得到实际应用。
了解什么是Raid?Raid的作用是什么?
Raid 6所需成员磁盘数:4块或4块以上;
优 点: 冗余,读写速度2倍;
缺 点: 相对可以利用的空间减少很多;
出现问题最多允许坏2/4块磁盘。

Raid 7: 一种新的RAID标准,其自身带有智能化实时操作系统和用于存储管理的软件工具,可完全独立于主机运行,不占用主机CPU资源。RAID 7可以看作是一种存储计算机(Storage Computer),它与其他RAID标准有明显区别。
优 点: 提高设备性能;
缺 点: 价格昂贵。

Raid 10:即Raid 1 + Raid 0,也被称为镜像阵列条带RAID 10提供100%的数据冗余,是将RAID 1和RAID 0标准结合的产物,在连续地以位或字节为单位分割数据并且并行读/写多个磁盘的同时,为每一块磁盘作磁盘镜像进行冗余。它的优点是同时拥有RAID 0的超凡速度和RAID 1的数据高可靠性,但是CPU占用率同样也更高,而且磁盘的利用率比较低。由于利用了RAID 0极高的读写效率和RAID 1较高的数据保护、恢复能力,使RAID 10成为了一种性价比较高的等级,目前几乎所有的RAID控制卡都支持这一等级。但是,RAID 10对存储容量的利用率和RAID 1一样低,只有50%。因此,RAID10即高可靠性与高效磁盘结构它是一个带区结构加一个镜象结构,可以达到既高效又高速的目的,RAID 10能提供比RAID 5更好的性能。组建RAID 10需要4个磁盘,其中两个为条带数据分布,提供了RAID 0的读写性能,而另外两个则为前面两个硬盘的镜像,保证了数据的完整备份。
了解什么是Raid?Raid的作用是什么?
先做RAID1,然后再做RAID0,因此Raid 10允许坏多个盘,只要不是一对磁盘坏就OK,应用最为广泛。
Raid 01:即Raid 0 + Raid 1,是存储性能和数据安全兼顾的方案。它在提供与RAID 1一样的数据安全保障的同时,也提供了与RAID 0近似的存储性能。由于RAID 0+1也通过数据的100%备份提供数据安全保障,因此RAID 0+1的磁盘空间利用率与RAID 1相同,存储成本高。RAID 0+1的特点使其特别适用于既有大量数据需要存取,同时又对数据安全性要求严格的领域,如银行、金融、商业超市、仓储库房、各种档案管理等。
了解什么是Raid?Raid的作用是什么?
先做两个RAID0,然后再做RAID1,因此RAID01允许坏多个盘,但只能坏在同一个RAID0中,不允许两个RAID0都有坏盘。

注意Raid 10 和 Raid01的区别:

RAID01,先进行条带存放(RAID0),再进行镜像(RAID1)。
RAID10,先进行镜像(RAID1),再进行条带存放(RAID0)。

Raid 50:即Raid 5 + Raid 0,也称分布奇偶位阵列条带,由两组RAID 5磁盘组成(每组最少3个),每一组都使用了分布式奇偶位,而两组硬盘再组建成RAID 0。RAID 50提供可靠的数据存储和优秀的整体性能,并支持更大的卷尺寸。即使两个物理磁盘发生故障(每个阵列中一个),数据也可以顺利恢复过来。RAID50具备更高的容错能力,因为它允许某个组内有一个磁盘出现故障,而不会造成数据丢失。而且因为奇偶位分部于RAID5子磁盘组上,故重建速度有很大提高。
了解什么是Raid?Raid的作用是什么?
Raid 50所需成员磁盘数:6块或6块以上,最少需要6个驱动器,它最适合需要高可靠性存储、高读取速度、高数据传输性能的应用。这些应用包括事务处理和有许多用户存取小文件的办公应用程序;
优 点: 更高的容错能力,具备更快数据读取速率的潜力。需要注意的是:磁盘故障会影响吞吐量。故障后重建信息的时间比镜像配置情况下要长。
缺 点: 价格过于昂贵;
出现问题最多允许坏1/3块磁盘。

6.RAID技术的应用:

1)DAS --direct access storage device直接访问存储设备;
DAS是磁盘存储设备的术语,以前被用在大、中型机上。使用在PC机上还包括硬盘设备DAS的最新形式是RAID。“直接访问”指访问所有数据的时间是相同的。
2)NAS --Network Attached Storage 网络附加存储设备;
一种特殊目的的服务器,它具有嵌入式的软件系统,可以通过网络对个种的系统平台提供文件共享服务 。
3)SAN --Storage Area Networks 存储区域网 ;
一种高速的专用网络,用于建立服务器、磁盘阵列和磁带库之间的一种直接联接。它如同扩展的存储器总线,将专用的集线器、交换器以及网关或桥路互相连接在一起。 SAN 常使用光纤通道。一个 SAN 可以是本地的或者是远程的,也可以是共享的或者是专用的。SAN 打破了存储器与服务器之间的束缚,允许你独立地选择最佳的存储器或者是最佳的服务器,从而提高可扩性和灵活性。