了解什么是Raid？Raid的作用是什么？

1.什么是Raid:
Raid全称（Redundant Array of inexpensive Disks廉价磁盘冗余阵列），而在我们的现实生活之中我们会发现磁盘并不廉价，所以我们现在也称之为独立磁盘冗余阵列。简单的理解就是将多块硬盘做一个组合来进行使用。
2.Raid的定义:
多个独立的物理硬盘按照不同的方式组合起来形成一块虚拟磁盘。实际生活中我们看到的是两块及两块以上的一个聚合。一般在工作环境中一个磁盘阵列的连接也是至少有两根线的，这样可以实现多路径，提高传输速率。
3.磁盘阵列:
磁盘阵列的样式有三种，一是外接式磁盘阵列柜、二是内接式磁盘阵列卡、三是利用软件来进行仿真。
1)外接式磁盘阵列柜最常被使用大型服务器上，具可热交换（Hot Swap）的特性，不过这类产品的价格都很贵。
了解什么是Raid？Raid的作用是什么？
2)内接式磁盘阵列卡，因为价格便宜，但需要较高的安装技术，适合技术人员使用操作。硬件阵列能够提供在线扩容、动态修改阵列级别、自动数据恢复、驱动器漫游、超高速缓冲等功能。它能提供性能、数据保护、可靠性、可用性和可管理性的解决方案。阵列卡专用的处理单元来进行操作。
了解什么是Raid？Raid的作用是什么？
3)利用软件仿真的方式，是指通过网络操作系统自身提供的磁盘管理功能将连接的普通SCSI卡上的多块硬盘配置成逻辑盘，组成阵列。软件阵列可以提供数据冗余功能，但是磁盘子系统的性能会有所降低，有的降低幅度还比较大，达30%左右。因此会拖累机器的速度，不适合大数据流量的服务器。
磁盘阵列还能利用同位检查（Parity Check）的观念，在数组中任意一个硬盘故障时，仍可读出数据，在数据重构时，将数据经计算后重新置入新硬盘中。
4.Raid的优势：
1)容量和管理方式上的优势:
易于灵活的进行容量扩展，’虚拟化’使管理性极大的增强。
2)性能上的优势:
磁盘分块技术，带来性能的提高。
3)Raid的可靠性和可用性：
通过冗余技术和热备、热换提升了可靠性。
5.Raid根据磁盘的不同组合方式形成不同的级别，但是我们必须要清楚Raid的级别没有好与坏之分，并不是说级别越高越好，只是组合方式不同性能不同选择方式也不同。
Raid技术主要包含Raid 0～Raid 50等数个级别，它们的侧重点各不相同，常见的级别有0 1 2 3 4 5 6 7 (及10、01、50等组合级别)。
Raid 0:条带技术，以条带的形式将数据均匀的分布在阵列上的各个磁盘之上。Raid 0连续以位或字节为单位分割数据，并行读/写于多个磁盘上，因此具有很高的数据传输率，但它没有数据冗余，因此并不能算是真正的RAID结构。RAID 0只是单纯地提高性能，并没有为数据的可靠性提供保证，而且其中的一个磁盘失效将影响到所有数据。因此，RAID 0不能应用于数据安全性要求高的场合。
了解什么是Raid？Raid的作用是什么？
Raid 0所需成员磁盘数:2个及2个以上;
优点:极高的读写效率，2倍;不存在校验、不会占用太多的CPU;设计、使用和配置比较简单;
缺点:不冗余，出现问题数据难恢复;
适用领域:视频生成和编辑、图像编辑等对大的传输带宽操作;
出现问题最多允许坏0块磁盘。
Raid 1:通过磁盘数据镜像实现数据冗余，在成对的独立磁盘上产生互为备份的数据。当原始数据繁忙时，可直接从镜像拷贝中读取数据，因此RAID 1可以提高读取性能。RAID 1是磁盘阵列中单位成本最高的，但提供了很高的数据安全性和可用性。当一个磁盘失效时，系统可以自动切换到镜像磁盘上读写，而不需要重组失效的数据。
了解什么是Raid？Raid的作用是什么？
Raid 1所需成员磁盘数:2N个(N>=1)，最低需要2个;
优点: 具有100%的数据冗余，提供最高的数据安全保障，理论上可以实现2倍的读取效率，设计和使用也比较简单;
缺点: 开销大，磁盘空间的利用率只有50%，在写操作方面性能并没有提升，如上图所示，我们可以清楚的看到相同的数据要写入到两个磁盘中去;
适用领域: 财务、金融等高可用、高安全的数据存储环境;
出现问题最多允许坏1块磁盘。
Raid 2:是Raid 0的改良版，以汉明码（Hamming Code）的方式将数据进行编码后分割为独立的位元，并将数据分别写入到硬盘中。因为在数据中加入了错误修正码（ECC，Error Correction Code），所以数据整体的容量会比原始数据大一些。Raid 2是为大型机和超级计算机开发的带汉明码校验磁盘阵列。它是将数据条带化地分布于不同的硬盘上，条块单位为位或者字节，并使用“加重平均纠错码”的编码技术来提供错误检查及恢复，这种纠错码也被称为“海明码”。海明码需要多个磁盘存放检查及恢复信息，使得RAID2技术实施更复杂，因此在商业环境中很少使用。
在写入时，RAID 2在写入数据位同时还要计算出它们的汉明码并写入校验阵列，读取时也要对数据即时地进行校验，最后再发向系统。汉明码只能纠正一个位的错误，所以RAID 2也只能允许一个硬盘出问题，如果两个或以上的硬盘出问题，RAID 2的数据就将受到破坏。但由于数据是以位为单位并行传输，所以传输率也相当快。
Raid 3: 带奇偶验证码的并行传送，Raid 3是把数据分成多个“块”，按照一定的容错算法，存放在N+1个硬盘上，实际数据占用的有效空间为N个硬盘的空间总和，而第N+1个硬盘上存储的数据是校验容错信息，当这N+1个硬盘中的其中一个硬盘出现故障时，从其它N个硬盘中的数据也可以恢复原始数据，这样，仅使用这N个硬盘也可以带伤继续工作（如采集和回放素材），当更换一个新硬盘后，系统可以重新恢复完整的校验容错信息。由于在一个硬盘阵列中，多于一个硬盘同时出现故障率的几率很小，所以一般情况下，使用RAID3，安全性是可以得到保障的。
Raid3同Raid 2非常类似，都是将数据条块化分布存储于不同的硬盘之上，区别在于Raid 3使用简单的奇偶校验算法，并用单块磁盘存放奇偶校验信息。如果一块磁盘失效，奇偶盘及其他数据盘可以重新产生数据；如果奇偶盘失效则不影响数据使用。Raid 3对于大量的连续数据可提供很好的传输率，但对于随机数据来说，奇偶盘会成为写操作的瓶颈。Raid 3是在Raid 2基础上发展而来的，主要的变化是用相对简单的异或逻辑运算（XOR，eXclusive OR）校验代替了相对复杂的汉明码校验，从而也大幅降低了成本。
了解什么是Raid？Raid的作用是什么？
优点: 具有100%的数据冗余，提供最高的数据安全保障，理论上可以实现2倍的读取效率，设计和使用也比较简单;
缺点: 开销大，磁盘空间的利用率只有50%，在写操作方面性能并没有提升，如上图所示，我们可以清楚的看到相同的数据要写入到两个磁盘中去;
适用领域: 财务、金融等高可用、高安全的数据存储环境；
出现问题最多允许坏1块磁盘。
Raid 4: 同样也将数据条块化并分布存储于不同的磁盘上，但Raid 4是按数据块为单位存储的，那么数据块应该怎么理解呢？简单的话，一个数据块是一个完整的数据集合，比如一个文件就是一个典型的数据块。当然，对于硬盘的读取，一个数据块并不是一个文件，而是由操作系统所决定的，这就是我们熟悉的簇（Cluster）。RAID 4这样按块存储可以保证块的完整，不受因分条带存储在其他硬盘上而可能产生的不利影响（比如当其他多个硬盘损坏时，数据就完了）。不过，在不同硬盘上的同级数据块也都通过XOR进行校验，结果保存在单独的校验盘中。
了解什么是Raid？Raid的作用是什么？
Raid 4所需成员磁盘数:3块或3块以上;
优点: 冗余，读写速度2倍;
缺点: 坏盘时另外2块需要重新计算还原坏盘数据,校验码盘压力大成为瓶颈;
出现问题最多允许坏1/3块磁盘。
Raid 5: 也被叫做带分布式奇偶位的条带，与Raid 4类似，但是不单独指定的奇偶盘，而是在所有磁盘上交叉地存取数据及奇偶校验信息。在Raid 5上，读/写指针可同时对阵列设备进行操作，提供了更高的数据流量，Raid 5更适合于小数据块和随机读写的数据。Raid 5与Raid 3相比，RAID 5把奇偶位信息也分布在所有的磁盘上，而并非一个磁盘上，大大减轻了奇偶校验盘的负担。尽管有一些容量上的损失，RAID 5却能提供较为完美的整体性能，因而也是被广泛应用的一种磁盘阵列方案。它适合于输入/输出密集、高读/写比率的应用程序，如事务处理等。为了具有RAID 5级的冗余度，我们需要至少三个磁盘组成的磁盘阵列。RAID 5可以通过磁盘阵列控制器硬件实现，也可以通过某些网络操作系统软件实现。
了解什么是Raid？Raid的作用是什么？
RAID 5 是一种存储性能、数据安全和存储成本兼顾的存储解决方案，目前使用最多的磁盘阵列。以4个硬盘组成的RAID 5为例，其数据存储方式如图所示，我们来进行分析：

如上图所示，P3为D9，D10和D11的奇偶校验信息，其它以此类推。 RAID 5不对存储的数据进行备份，而是把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上，并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。当RAID5的一个磁盘数据发生损坏后，利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。
RAID 5可以理解为是RAID 0和RAID 1的折衷方案。RAID 5可以为系统提供数据安全保障，但保障程度要比Mirror低而磁盘空间利用率要比Mirror高。RAID 5具有和RAID 0相近似的数据读取速度，只是多了一个奇偶校验信息，写入数据的速度比对单个磁盘进行写入操作稍慢。同时由于多个数据对应一个奇偶校验信息，RAID 5的磁盘空间利用率要比RAID 1高，存储成本相对较低。
Raid 5所需成员磁盘数:3块或3块以上;
优点: 冗余，读写速度2倍;
缺点: 坏盘时另外2块需要重新计算还原坏盘数据;
出现问题最多允许坏1/3块磁盘。
Raid 6: 是由一些大型企业提出来的私有RAID级别标准，它的全称叫“Independent Data disks with two independent distributed parity schemes(带有两个独立分布式校验方案的独立数据磁盘)”。这种RAID级别是在RAID 5的基础上发展而成，因此它的工作模式与RAID 5有异曲同工之妙，不同的是RAID 5将校验码写入到一个驱动器里面，而RAID 6将校验码写入到两个驱动器里面，这样就增强了磁盘的容错能力，同时RAID 6阵列中允许出现故障的磁盘也就达到了两个，但相应的阵列磁盘数量最少也要4个。
与RAID 5相比，RAID 6虽然增加了第二个独立的奇偶校验信息块，两个独立的奇偶系统使用不同的算法，数据的可靠性非常高，即使两块磁盘同时失效也不会影响数据的使用。但RAID 6需要分配给奇偶校验信息更大的磁盘空间，相对于RAID 5有更大的“写损失”，因此“写性能”非常差。较差的性能和复杂的实施方式使得RAID 6很少得到实际应用。
了解什么是Raid？Raid的作用是什么？
Raid 6所需成员磁盘数:4块或4块以上;
优点: 冗余，读写速度2倍;
缺点: 相对可以利用的空间减少很多;
出现问题最多允许坏2/4块磁盘。
Raid 7: 一种新的RAID标准，其自身带有智能化实时操作系统和用于存储管理的软件工具，可完全独立于主机运行，不占用主机CPU资源。RAID 7可以看作是一种存储计算机（Storage Computer），它与其他RAID标准有明显区别。
优点: 提高设备性能;
缺点: 价格昂贵。
Raid 10:即Raid 1 + Raid 0，也被称为镜像阵列条带，RAID 10提供100%的数据冗余，是将RAID 1和RAID 0标准结合的产物，在连续地以位或字节为单位分割数据并且并行读/写多个磁盘的同时，为每一块磁盘作磁盘镜像进行冗余。它的优点是同时拥有RAID 0的超凡速度和RAID 1的数据高可靠性，但是CPU占用率同样也更高，而且磁盘的利用率比较低。由于利用了RAID 0极高的读写效率和RAID 1较高的数据保护、恢复能力，使RAID 10成为了一种性价比较高的等级，目前几乎所有的RAID控制卡都支持这一等级。但是，RAID 10对存储容量的利用率和RAID 1一样低，只有50%。因此，RAID10即高可靠性与高效磁盘结构它是一个带区结构加一个镜象结构，可以达到既高效又高速的目的，RAID 10能提供比RAID 5更好的性能。组建RAID 10需要4个磁盘，其中两个为条带数据分布，提供了RAID 0的读写性能，而另外两个则为前面两个硬盘的镜像，保证了数据的完整备份。
了解什么是Raid？Raid的作用是什么？
先做RAID1，然后再做RAID0，因此Raid 10允许坏多个盘，只要不是一对磁盘坏就OK，应用最为广泛。
Raid 01:即Raid 0 + Raid 1，是存储性能和数据安全兼顾的方案。它在提供与RAID 1一样的数据安全保障的同时，也提供了与RAID 0近似的存储性能。由于RAID 0+1也通过数据的100%备份提供数据安全保障，因此RAID 0+1的磁盘空间利用率与RAID 1相同，存储成本高。RAID 0+1的特点使其特别适用于既有大量数据需要存取，同时又对数据安全性要求严格的领域，如银行、金融、商业超市、仓储库房、各种档案管理等。
了解什么是Raid？Raid的作用是什么？
先做两个RAID0，然后再做RAID1，因此RAID01允许坏多个盘，但只能坏在同一个RAID0中，不允许两个RAID0都有坏盘。

注意Raid 10 和 Raid01的区别：

RAID01，先进行条带存放（RAID0），再进行镜像（RAID1）。
RAID10，先进行镜像（RAID1），再进行条带存放（RAID0）。
Raid 50:即Raid 5 + Raid 0，也称分布奇偶位阵列条带，由两组RAID 5磁盘组成（每组最少3个），每一组都使用了分布式奇偶位，而两组硬盘再组建成RAID 0。RAID 50提供可靠的数据存储和优秀的整体性能，并支持更大的卷尺寸。即使两个物理磁盘发生故障（每个阵列中一个），数据也可以顺利恢复过来。RAID50具备更高的容错能力，因为它允许某个组内有一个磁盘出现故障，而不会造成数据丢失。而且因为奇偶位分部于RAID5子磁盘组上，故重建速度有很大提高。
了解什么是Raid？Raid的作用是什么？
Raid 50所需成员磁盘数:6块或6块以上，最少需要6个驱动器，它最适合需要高可靠性存储、高读取速度、高数据传输性能的应用。这些应用包括事务处理和有许多用户存取小文件的办公应用程序;
优点: 更高的容错能力，具备更快数据读取速率的潜力。需要注意的是：磁盘故障会影响吞吐量。故障后重建信息的时间比镜像配置情况下要长。
缺点: 价格过于昂贵;
出现问题最多允许坏1/3块磁盘。

6.RAID技术的应用:

1)DAS --direct access storage device直接访问存储设备;
DAS是磁盘存储设备的术语，以前被用在大、中型机上。使用在PC机上还包括硬盘设备DAS的最新形式是RAID。“直接访问”指访问所有数据的时间是相同的。
2)NAS --Network Attached Storage 网络附加存储设备;
一种特殊目的的服务器,它具有嵌入式的软件系统,可以通过网络对个种的系统平台提供文件共享服务。
3)SAN --Storage Area Networks 存储区域网 ;
一种高速的专用网络，用于建立服务器、磁盘阵列和磁带库之间的一种直接联接。它如同扩展的存储器总线，将专用的集线器、交换器以及网关或桥路互相连接在一起。 SAN 常使用光纤通道。一个 SAN 可以是本地的或者是远程的，也可以是共享的或者是专用的。SAN 打破了存储器与服务器之间的束缚，允许你独立地选择最佳的存储器或者是最佳的服务器，从而提高可扩性和灵活性。

了解什么是Raid？Raid的作用是什么？

注意Raid 10 和 Raid01的区别：

6.RAID技术的应用:

相关推荐