RAID và nguyên tắc hoạt động các chế độ RAID phổ biến

RAID là gì?

RAID là viết tắt của Redundant Arrays of Independent Disks là hình thức gộp nhiều ổ đĩa cứng vật lý thành một hệ thống ổ đĩa cứng có chức năng gia năng khả năng đọc/ghi và truy xuất dữ liệu từ đĩa cứng. Nhằm tăng thêm sự an toàn của dữ liệu chứa trên hệ thống đĩa hoặc kết hợp cả hai yếu tố trên.

RAID là gì?

Các đĩa có thể được kết hợp thành mảng theo nhiều cách khác nhau được gọi là cấp RAID. Mỗi cấp độ RAID có các đặc điểm riêng về:

  • Fault-tolerance (Khả năng chịu lỗi): Là khả năng tồn tại của một hoặc vài lỗi đĩa.
  • Performance (Hiệu suất): Cho thấy sự thay đổi tốc độ đọc và ghi của toàn bộ mảng so với một đĩa đơn.
  • The capacity of the array (Dung lượng của ổ đĩa): Được xác định bởi lượng dữ liệu người dùng có thể được ghi vào ổ đĩa. Dung lượng ổ đĩa phụ thuộc vào cấp độ RAID và không phải lúc nào cũng khớp với tổng kích thước của các đĩa thành viên RAID. Để tính toán dung lượng của loại RAID cụ thể và một bộ đĩa thành viên. Bạn có thể sử dụng  RAID calculator trực tuyến miễn phí.

Lịch sử phát triển của RAID

Để hiểu hơn RAID là gì?

RAID được phát triển lần đầu tiên vào năm 1887 tại trường Đại học California tại Berkeley (Hoa Kỳ) với đặc điểm chỉ ghép các phần đĩa cứng nhỏ hơn thông qua phần mềm để tạo ra một hệ thống đĩa dung lượng lớn hơn thay thế cho các ổ cứng dung lượng lớn hồi đó.

Tuy hiện tại không còn tồn tại, nhưng Hội đồng tư vấn phát triển RAID (RAB) được thành lập năm 1992 để định hướng và lập ra các tiêu chuẩn, định dạng cho RAID. RAB đã phân loại cho RAID (level), các tiêu chuẩn phần cứng sử dụng RAID.

Tổ chức của RAID

Hai khía cạnh độc lập được phân biệt rõ ràng trong tổ chức RAID.

  • Việc tổ chức dữ liệu trong mảng (Các kỹ thuật lưu trữ RAID: stripe, mirror,parity, kết hợp chúng).
  • Thực hiện từng cài đặt RAID cụ thể – phần cứng hoặc phần mềm.

Kỹ thuật lưu trữ RAID

Các phương thức lưu trữ dữ liệu chính trong mảng là:

  • Striping (Phân chia dải): Tách luồng dữ liệu thành các khối có kích thước nhất định (được gọi là kích thước khối) sau đó viết từng khối này qua từng RAID. Cách lưu trữ dữ liệu này ảnh hưởng đến hiệu suất.
  • Mirroring (mirroring): Là một kỹ thuật lưu trữ trong đó các bản sao dữ liệu giống hệt nhau được lưu trữ trên các thành viên RAID cùng một lúc. Loại vị trí dữ liệu này ảnh hưởng đến khả năng chịu lỗi cũng như hiệu suất.
  • Parity là một kỹ thuật lưu trữ được sử dụng các phương pháp phân loại và tổng kiểm tra. Trong kỹ thuật chẵn lẻ, một hàm chẵn lẻ nhất định được tính cho các khối dữ liệu. Nếu một ổ đĩa bị lỗi, khối bị thiếu được tính toán lại từ tổng kiểm tra, cung cấp khả năng chịu lỗi RAID.

Tất cả các loại RAID hiện có đều dựa trên phân dải, mirroring, chẵn lẻ. Hoặc kết hợp các kỹ thuật lưu trữ này.

Phân loại RAID

Khi bạn đã nắm được khái niệm RAID là gì? Bây giờ bạn có thể tìm hiểu sâu hơn về RAID bằng cách xem phân loại RAID chi tiết ở dưới đây.

RAID được RAB chia thành 7 cấp độ (level), mỗi cấp độ có những đặc tính riêng và hầu hết chúng được xây dựng từ hai cấp độ cơ bản là RAID 0 và RAID 1.

RAID 0

RAID 0 – dựa trên kỹ thuật striping. Mức RAID này không cung cấp khả năng chịu lỗi nhưng tăng hiệu năng hệ thống (tốc độ đọc và ghi cao). RAID 0 cần ít nhất 2 ổ đĩa (có thể sử dụng 1 ổ đĩa). Tổng quát ta có n đĩa (n>=2) và các đĩa là cùng loại. Dữ liệu sẽ được chia ra thành nhiều phần bằng nhau. Ví dụ có 2 ổ cứng 80GB thì hệ thống ổ đĩa sẽ là 160GB.

RAID 0 là gì?
  • Ưu điểm: Tăng tốc độ đọc/ghi ổ đĩa, mỗi đĩa chỉ cần đọc/ghi 1/n lượng dữ liệu yêu cầu.
  • Nhược điểm: Tính an toàn thấp vì nếu một đĩa hư thì dữ liệu trên tất cả các đĩa còn lại sẽ không còn sử dụng được.
  • Sử dụng lý tưởng: RAID 0 lý tưởng cho việc lưu trữ dữ liệu không quan trọng cần được đọc / ghi ở tốc độ cao. Chẳng hạn như trên chỉnh sửa hình ảnh hoặc video.

RAID 1

RAID 1 – sử dụng kỹ thuật mirroring, tăng tốc độ đọc trong một số trường hợp. Và cung cấp khả năng chịu lỗi khi mất không quá một đĩa thành viên. Đây là RAID cơ bản nhất có khả năng đảm bảo an toàn dữ liệu. Cũng giống như RAID 0, thì RAID 1 cũng yêu cầu 2 ổ đĩa cứng để làm việc. Dữ liệu sẽ được ghi vào 2 ổ đĩa giống nhau (Mirroring) và nếu một ổ đĩa gặp trục trặc thì ổ đĩa còn lại vẫn làm việc và hoạt động bình thường.

RAID 1

Người dùng có thể thay thế ổ đĩa bị hỏng mà không cần quá lo lắng đến vấn đề thông tin bị mất. Với RAID 1 thì hiệu năng không phải là yếu tố hàng đầu nên không có gì ngạc nhiên khi không phải là lựa chọn cho những người yêu thích về tốc độ. Tuy nhiên, đối với những người quản trị mạng hoặc người quản lý nhiều thông tin thì RAID 1 là thứ không thể thiếu. Dung lượng cuối cùng của hệ thống RAID 1 sẽ bằng dung lượng của ổ đơn.

Ví dụ: 2 ổ cứng 80GB chạy RAID 1 sẽ cho hệ thống nhìn thấy duy nhất một ổ RAID 80GB.,

  • Ưu điểm: RAID 1 cung cấp tốc độ đọc tuyệt vời và tốc độ ghi có thể so sánh với tốc độ của một ổ đĩa duy nhất. Trong trường hợp một ổ đĩa bị lỗi, dữ liệu không cần phải được xây dựng lại. Chỉ cần sao chép chúng vào ổ đĩa drive thay thế.
  • Nhược điểm: Dung lượng lưu trữ hiệu quả chỉ bằng một nửa tổng dung lượng drive. Vì tất cả dữ liệu đều được ghi hai lần. Các giải pháp phần mềm RAID 1 không phải lúc nào cũng cho phép hoán đổi nhanh ở drive bị lỗi. Điều đó có nghĩa là drive bị lỗi chỉ có thể được thay thế sau khi tắt nguồn máy tính mà nó được gắn vào. Đối với các server được sử dụng đồng thời bởi nhiều người, điều này có thể không được chấp nhận. Các hệ thống như vậy thường sử dụng bộ điều khiển phần cứng hỗ trợ hoán đổi nhanh.
  • Sử dụng lý tưởngRAID-1 lý tưởng cho nhiệm vụ lưu trữ quan trọng, chẳng hạn như cho các hệ thống kế toán. Nó cũng thích hợp cho các server nhỏ, trong đó chỉ có hai drive dữ liệu sẽ được sử dụng.

RAID 0+1

RAID 0 + 1 – dựa trên sự kết hợp giữa kỹ thuật striping và mirroring. Cấp độ RAID này kế thừa hiệu năng RAID 0 và khả năng chịu lỗi RAID 1. Chi phí cho hệ thống RAID này là khá đắt vì nó yêu cầu tối thiểu 4 ổ đĩa cứng. Tất cả dữ liệu sẽ được ghi đồng thời lên 4 ổ đĩa với 2 ổ dạng Striping và 2 ổ dạng Mirroring. Dung lượng cuối cùng sẽ bằng 1/2 tổng dung lượng 4 ổ đĩa.

RAID 0+1

Ví dụ: 4 ổ đĩa 80GB thì dung lượng mà hệ thống thấy được bằng (80*4)/2=160GB.

RAID 1+0 (RAID 10)

Raid 10 là gì

Raid 10 là sự kết hợp giữa 2 loại raid phổ biến và Raid 1 và Raid 0. Để setup Raid 10 khách hàng cần sử dụng tối thiểu 4 ổ cứng (Disk 0, Disk 1, Disk 2, Disk 3).

Đối với Raid 10 dữ liệu sẽ được lưu đồng thời vào 4 ổ cứng. 2 ổ dạng Striping (Raid 0) và 2 ổ (Mirroring) Raid 1.

Ưu điểm: Đây là 1 hình thức lưu trữ nhanh nhẹn và an toàn. Vừa nâng cao hiệu suất mà lại đảm bảo dữ liệu không bị thất thoát khi 1 trong số 4 ổ cứng bị hỏng.

Nhược điểm: Chi phí cao. Đối với Raid 10 dung lượng sẵn sàng sử dụng chỉ bằng ½ dung lượng của 4 ổ. (giống như raid 1).

Đối tượng sử dụng: Raid 10 thích hợp với tất cả các đối tượng sử dụng (từ những yêu cầu về hiệu suất đến việc đảm bảo an toàn dữ liệu). Về ổ cứng yêu cầu phải 4 ổ cùng dung lượng, nếu 4 ổ khác dung lượng thì lấy ổ thấp nhất.

Một số người cho rằng RAID 10 có điểm yếu so với RAID 6 (mặc dù rất hiếm gặp): RAID 10. Khi có hai ổ đĩa chết trong cùng một phía mirror, khi đó dữ liệu bị mất hoàn toàn. Tình huống này không diễn ra với RAID 6, khi có hai ổ đĩa bất kỳ chết cùng một lúc, mảng vẫn hoạt động bình thường.

RAID 5

RAID 5 – sử dụng cả kỹ thuật phân stripe và parity. Cung cấp cải thiện tốc độ đọc như trong RAID 0 xấp xỉ, tồn tại khi mất một đĩa thành viên RAID. Có cơ chế khôi phục dũ liệu, các parity dùng để khổi phục dữ liệu được phân bổ đều trên tất cả các ổ cứng. RAID 5 yêu cầu tối thiểu 3 ổ cứng.

RAID 5 là gì?

Ví dụ dữ liệu A được phân tách thành 3 phần A1, A2, A3, khi đó dữ liệu được chia thành 3 phần chứa trên các ổ đĩa cứng 0, 1, 2 (giống như RAID 0). Phần ổ đĩa cứng thứ 3 chứa Parity (Ap) của A1, A2, A3 để khôi phục dữ liệu có thể sẽ mất ở ổ đĩa cứng 0, 1, 2.

Dữ liệu B được chia thành B1 B2 B3 và Parity của nó là Bp, theo thứ tự B1 B2 B3 được lưu trữ tại ổ 0 1 3, và Bp được lưu trữ tại ổ 2. Các Parity được lưu trữ tuần tự trên các ổ đĩa cứng. RAID 5 cho phép tối đa có 1 ổ cứng bị chết tại một thời điểm, nếu có nhiều hơn 1 ổ cứng bị chết tại một thời điểm thì toàn bộ dữ liệu coi như mất hết. RAID 5 cũng yêu cầu các ổ cứng tham gia RAID phải có dung lượng bằng nhau.

Dung lượng cuối cùng RAID 5 được tính: (Dung lượng 1 ổ cứng) x [(Số lượng ổ cứng tham gia) – 1].

  • Ưu điểm: Các giao dịch dữ liệu đọc rất nhanh trong khi các giao dịch dữ liệu ghi có phần chậm hơn (do parity phải được tính toán). Nếu một drive bị lỗi, bạn vẫn có quyền truy cập vào tất cả dữ liệu. Ngay cả khi drive bị lỗi đang được thay thế và bộ điều khiển lưu trữ rebuild dữ liệu trên ổ đĩa mới.
  • Nhược điểm: Lỗi drive có ảnh hưởng đến thông lượng, mặc dù điều này vẫn có thể chấp nhận được. Đây là công nghệ phức tạp. Nếu một trong các đĩa trong mảng sử dụng đĩa 4TB bị lỗi và cần thay thế, việc khôi phục dữ liệu có thể mất một ngày hoặc lâu hơn. Việc này tùy thuộc vào load trên array và tốc độ của bộ điều khiển. Nếu một đĩa khác bị hỏng trong thời gian đó, dữ liệu sẽ bị mất vĩnh viễn.
  • Sử dụng lý tưởng: RAID 5 là một hệ thống toàn diện tốt, kết hợp khả năng lưu trữ hiệu quả với khả năng bảo mật tuyệt vời và hiệu suất tốt. Nó lý tưởng cho các server file và ứng dụng có số lượng ổ đĩa dữ liệu hạn chế.

RAID 6

RAID 6 giống như RAID 5, nhưng dữ liệu chẵn lẻ (parity) được ghi vào hai ổ đĩa. Điều đó có nghĩa là nó cần ít nhất 4 drive và có thể chịu được 2 drive đồng thời. Tất nhiên, khả năng hai drive bị hỏng vào cùng một thời điểm là rất nhỏ.

Raid 6

Tuy nhiên, nếu một drive trong hệ thống RAID 5 bị chết và được thay thế bằng một drive mới, thì phải mất hàng giờ hoặc thậm chí hơn một ngày để rebuild drive đã hoán đổi. Nếu một drive khác bị chết trong thời gian đó, bạn vẫn mất tất cả dữ liệu của mình. Ở trường hợp thứ hai, với RAID 6, array RAID thậm chí vẫn sẽ tồn tại.

  • Ưu điểm: Giống như với RAID 5, các chuyển đổi dữ liệu đọc rất nhanh. Nếu hai drive bị lỗi, bạn vẫn có quyền truy cập vào tất cả dữ liệu. Nngay cả khi các drive bị lỗi đang được thay thế. Vì vậy RAID 6 bảo mật hơn RAID 5.
  • Nhược điểm: Ghi dữ liệu chuyển đổi chậm hơn RAID 5 do dữ liệu parity bổ sung phải được tính toán. Một báo cáo từng cho thấy hiệu suất ghi của RAID 6 thấp hơn 20% so với RAID 5. Lỗi drive có ảnh hưởng đến thông lượng, mặc dù điều này vẫn có thể chấp nhận được. Đây là công nghệ phức tạp. Việc rebuild một array có drive bị lỗi có thể mất nhiều thời gian.
  • Sử dụng lý tưởng: RAID 6 là một hệ thống toàn diện, kết hợp khả năng lưu trữ hiệu quả với bảo mật tuyệt vời và hiệu suất cao. Nó được ưu tiên hơn RAID 5 trong các server ứng dụng và file mà sử dụng nhiều drive lớn để lưu trữ dữ liệu.

Các loại RAID khác

  • RAID1E – sử dụng cả hai kỹ thuật striping và mirroring , có thể tồn tại lỗi của một đĩa thành viên hoặc bất kỳ số lượng đĩa không liền kề nào. Có ba kiểu con của bố cục RAID 1E: near, interleaved, and far. Thêm thông tin và sơ đồ trên trang RAID 1E .
  • RAID 5E – một biến thể của bố cục RAID 5. Điểm khác biệt duy nhất là không gian dự phòng. Tích hợp cho phép xây dựng lại một mảng bị lỗi ngay lập tức trong trường hợp đĩa bị lỗi. Đọc thêm trên trang RAID5E.
  • Còn các cấp độ 2,3,4,7 còn tồn tại nhưng không phổ biến. RAID 3 về cơ bản giống như RAID. Nhưng dữ liệu parity luôn được ghi vào cùng một drive).
  • Đây chỉ là một giới thiệu đơn giản về hệ thống RAID. Bạn có thể tìm thêm thông tin chuyên sâu trên các trang của Wikipedia hoặc đón chờ những bài viết tiếp theo về RAID của Vietnix!

Triển khai RAID

RAID có thể được tạo bằng hai cách khác nhau:

  • Với việc sử dụng trình điều khiển hệ điều hành, được gọi là software RAID;
  • Với việc sử dụng phần cứng đặc biệt, được gọi là hardware RAID.

RAID phần mềm

Phần mềm RAID là một trong những giải pháp RAID rẻ nhất. Ngày nay, hầu hết mọi hệ điều hành đều có khả năng tích hợp để tạo RAID, mặc dù không phải cho tất cả các cấp RAID. Do đó, phiên bản Windows Home cho phép người dùng chỉ tạo RAID 0, trong khi RAID 1 và RAID 5 chỉ có thể được tạo bằng phiên bản máy chủ Windows. Bố cục RAID được tạo bởi phương tiện của Windows được liên kết không thể tách rời với hệ điều hành máy chủ và do đó, phân vùng của nó không thể được sử dụng.

RAID phần mềm

RAID phần mềm được tạo dựa trên máy tính của người dùng và do đó nó sử dụng CPU hệ thống máy chủ để thực hiện. Cần lưu ý rằng, trong trường hợp RAID cấp 0 và 1, tải CPU là không đáng kể, nhưng đối với các loại RAID dựa trên tính chẵn lẻ, tải CPU có thể thay đổi từ 1 đến 5% tùy thuộc vào sức mạnh CPU và số lượng đĩa, cũng không đáng kể cho các mục đích thực tế.

Có một số hạn chế nhất định về việc sử dụng RAID phần mềm để khởi động hệ thống. Chỉ RAID 1 có thể chứa phân vùng khởi động, trong khi không thể khởi động hệ thống với phần mềm RAID 5 và RAID 0.

Hãy nhớ rằng trong hầu hết các trường hợp, phần mềm RAID không thực hiện trao hot swap và do đó không thể sử dụng phần mềm khi cần có tính liên tục.

RAID phần cứng

RAID phần cứng được tạo bằng phần cứng riêng và về cơ bản có hai lựa chọn:

  • Chip RAID rẻ tiền có thể được tích hợp vào bo mạch chủ.
  • Tùy chọn đắt tiền hơn với bộ điều khiển RAID độc lập phức tạp. Các bộ điều khiển như vậy có thể được trang bị CPU của riêng chúng, bộ nhớ đệm được sao lưu bằng pin và chúng thường hỗ trợ trao đổi nóng.

RAID phần cứng có một số lợi thế so với RAID phần mềm, chẳng hạn như:

  • Không sử dụng CPU của máy chủ
  • Cho phép người dùng tạo phân vùng khởi động
  • Xử lý lỗi tốt hơn, vì giao tiếp với các thiết bị trực tiếp
  • Hỗ trợ trao đổi nóng.

RAID không thể thay thế cho các back-up

Tất cả các cấp độ RAID ngoại trừ RAID 0 đều cung cấp khả năng bảo vệ một khỏi lỗi drive. Hệ thống RAID 6 thậm chí còn sống sót khi 2 drive chết đồng thời. Để bảo mật hoàn toàn, bạn vẫn cần back-up dữ liệu được lưu trữ trên hệ thống RAID.

  • Việc back-up đó sẽ có ích nếu tất cả các ổ drive bị lỗi đồng thời do tăng đột dòng điện.
  • Phương án dự phòng khi hệ thống lưu trữ bị đánh cắp.
  • Các bản sao lưu có thể được giữ bên ngoài cơ sở tại một địa điểm khác. Điều này có thể hữu ích nếu một thảm họa tự nhiên hoặc hỏa hoạn phá hủy nơi làm việc của bạn.
  • Lý do quan trọng nhất để back-up nhiều lớp dữ liệu là do lỗi của người dùng. Nếu ai đó vô tình xóa một số dữ liệu quan trọng và điều này không được thông báo trong vài giờ, vài ngày hoặc vài tuần, thì một tập hợp các bản back-up tốt đảm bảo rằng bạn vẫn có thể truy xuất các file đó.

Lời kết

Hy vọng với những thông tin trong bài viết về RAID là gì? sẽ mang lại cho bạn thêm nhiều kiến thức mới về các loại RAID để bạn có thể tham khảo và lựa chọn RAID phù hợp nhất cho mình. Chúc bạn thành công.

Chia sẻ cho bạn bè cùng đọc