Chuyên gia phân tích lưu trữ và lưu trữ đám mây Backblaze vừa công bố một báo cáo thú vị về độ tin cậy của hàng trăm nghìn ổ cứng được triển khai trên các máy chủ của công ty — Backblaze đã quản lý 236.893 ổ cứng kể từ quý 1 năm 2023. Báo cáo bao gồm độ tin cậy và lỗi gặp phải trên các mô hình khác nhau.
Tính đến Số giờ bật nguồn cho mọi ổ cứng bị lỗi trong khi loại trừ ổ đĩa khởi động không thành công, ổ đĩa không có dữ liệu thuộc tính thô SMART hoặc ổ đĩa có dữ liệu vượt quá giới hạn, Backblaze đã ghi nhận 17.155 ổ cứng bị chết kể từ khi bắt đầu hoạt động. Tính trung bình, các ổ cứng bị lỗi có thời gian hoạt động trung bình chỉ hai năm sáu tháng. Nếu bạn ở Châu Âu, độ bền đó kém hơn so với bảo hành tối thiểu theo yêu cầu của pháp luật, tức là ba năm.
Backblaze đã nhóm các ổ cứng chết trong 30 mẫu, loại trừ những mẫu có ít hơn 50 lỗi để không làm sai lệch kết quả với các giá trị ngoại lệ. Dưới đây là các mô hình (từ 4TB đến 12TB) trong một bảng gọn gàng:
Backblaze lưu ý một số xu hướng trong đánh giá của nó và bản thân bảng cung cấp cho chúng tôi một số điểm dữ liệu thú vị. Thứ nhất, chúng tôi thấy rằng Seagate là vua của các lỗi ổ đĩa. Seagate ST12000NM0007 12TB của nó gặp 2.023 lần hỏng hóc, dẫn đến Tỷ lệ hỏng hóc trung bình (AFR) lớn nhất là 7,46% và tuổi thọ trung bình chỉ một năm sáu tháng. Mẫu ổ đĩa tệ thứ hai trong thống kê của Backblaze là một ổ đĩa khác của Seagate, ổ đĩa 14TB ST1400NM0138 có AFR là 6,23%. Mẫu ổ đĩa tệ thứ ba là 4TB HUH728080ALE604 của HGST, với tỷ lệ hỏng hóc hàng năm là 4,33%.
Kết quả của Backblaze có thể được hiểu là ổ cứng lớn hơn có xu hướng ít hỏng hóc hơn ổ cứng nhỏ hơn, nhưng có một số lưu ý ở đây. Đầu tiên, Backblaze chỉ ra rằng tất cả các ổ cứng “dung lượng nhỏ” của họ đã bị lỗi: công ty không còn sử dụng ổ cứng 1, 1,5, 2, 3 hoặc thậm chí 5 TB nữa — tất cả các lỗi trong các mẫu đó đều đã ” được tính” vào tỷ lệ thất bại của Backblaze. Đó không phải là trường hợp của các ổ đĩa có dung lượng cao hơn, mà cũng có nhiều khả năng có thời gian chạy thấp hơn, như trường hợp chung của các tùy chọn lưu trữ của Backblaze.
Backblaze đã phân tích thêm nhóm ổ cứng của mình bằng cách xem xét tỷ lệ hỏng hóc trung bình giữa các nhà sản xuất, trong đó Seagate tuyên bố tỷ lệ hỏng hóc trung bình hàng đầu là 2,28%, trong khi WDC tuyên bố tỷ lệ hỏng hóc trung bình ít nhất với kết quả 0,31%. Khi xem xét những con số này, điều quan trọng cần nhớ là ngay cả tỷ lệ hỏng hóc của Seagate cũng có nghĩa là chỉ 2,3 trong số hàng trăm ổ cứng HDD được xuất xưởng ngừng quay đĩa cứng trước khi chúng cần.
Nhìn chung, Backblaze kết thúc với tỷ lệ thất bại trung bình trong Quý 1 năm 2023 là 1,54%, tăng theo quý từ 1,21% trong Quý 4 năm 2022 và cũng tăng theo năm, trong đó Quý 1 năm 2022 đăng ký AFR 1,22%. Điều này có thể có nghĩa là một số kiểu máy có độ bền thấp hơn dự kiến và đã bắt đầu hỏng hóc. Nó cũng có thể là vấn đề với một lô ổ đĩa, hoặc từ việc xử lý, lắp đặt và điều kiện vận hành. Nói một cách đơn giản, không có cách nào để nói rằng “HDD đang trở nên tồi tệ hơn” từ dữ liệu này vì có quá nhiều ẩn số.
Báo cáo Tỷ lệ lỗi hàng năm của Backblaze có vẻ tương đối phù hợp với phân tích lỗi ổ cứng tương tự được thực hiện bởi Secure Data Recovery, một công ty khôi phục dữ liệu HDD, SSD và RAID. Nó đã xem xét 2.007 ổ cứng và nhận thấy tuổi thọ trung bình của chúng trước khi hỏng hóc là khoảng 2 năm 10 tháng. Con số này chỉ cách 4 tháng so với kết quả 2 năm 6 tháng của Backblaze.
Đây là hy vọng rằng cả hai nhà cung cấp tiếp tục phân tích tỷ lệ thất bại và cung cấp dữ liệu đó một cách công khai. Và nếu bạn có dữ liệu quan trọng mà bạn không thể đánh mất, hãy đảm bảo rằng bạn có một chiến lược sao lưu tốt — ngay cả những thứ đơn giản như thiết bị lưu trữ bên ngoài cũng tốt hơn là không có gì.