Nhà phát triển Linux của Red Hat, Richard WM Jones, đã chia sẻ một câu chuyện nhướng mày về việc săn lỗi Linux. Jones nhận thấy rằng Linux 6.4 có một lỗi có nghĩa là nó sẽ bị treo khi khởi động khoảng 1 trên 1.000 lần. Jones bắt đầu xác định chính xác lỗi và chứng minh rằng anh ấy đã bắt được nó một cách thuận lợi. Tuy nhiên, công việc gây chú ý của anh ấy, liên quan đến việc khởi động Linux 292.612 lần (và 1.000 lần khác để xác nhận lỗi) dường như “chỉ mất 21 giờ”. Có vẻ như lỗi này ít phổ biến hơn với phần cứng Intel so với các máy dựa trên AMD.
Jones lần đầu tiên phát hiện ra lỗi khởi động Linux khó nắm bắt nhưng có thể sao chép này khi một số phần mềm máy chủ kiểm tra nbdkit (một giao thức để truy cập các thiết bị khối qua mạng) dường như bị “treo ngẫu nhiên” khi được sử dụng với libguestsfs (một công cụ để truy cập và sửa đổi máy ảo hình ảnh đĩa.) Mặc dù chúng tôi biết rằng giai đoạn thử nghiệm vòng lặp chỉ dài 21 giờ (mặc dù đã có 293.612 quá trình khởi động thiên văn được bắt đầu) Jones nói rằng để đạt được điểm này “mất nhiều ngày”. Nhà phát triển Linux kể lại rằng sự chia đôi đau đớn giữa Linux v6.0 và v6.4-rc6 đã giúp anh ta thu hẹp thủ phạm treo khởi động. Thủ phạm đó được cho là hồi quy trong tính năng thời gian printk. Jones khẳng định rằng việc hoàn nguyên cam kết mã này sẽ “khắc phục sự cố”.
Manh mối cho nguyên nhân là lỗi luôn xuất hiện ở cùng giai đoạn đầu của quá trình khởi động, khi khởi động qemu mới nhất. Nếu bạn theo liên kết này, bạn sẽ thấy cách dễ nhất để sao chép sự cố treo là chạy lệnh guestfish trong một vòng lặp, với nhiều phiên bản song song, phân tích cú pháp đầu ra để phát hiện khi có sự kiện treo khởi động. Thông thường, anh ấy chạy vòng lặp guestfish 10.000 lần, như một ngưỡng khả thi để thu thập dữ liệu nhật ký hữu ích.
Có lẽ một số người hâm mộ phần cứng quan tâm, Jones nhận xét rằng sự cố treo khởi động kỳ lạ này ít xảy ra trên hệ thống Intel hơn so với hệ thống AMD. Dù thế nào đi chăng nữa, hy vọng rằng việc tiếp xúc và xác định chính xác lỗi này có nghĩa là lỗi đó sẽ bị tiêu diệt, không bao giờ quay trở lại.