Dev Boots Linux 292.612 lần để tìm lỗi hạt nhân Intel, AMD

Nhà phát triển Linux của Red Hat, Richard WM Jones, đã chia sẻ một câu chuyện nhướng mày về việc săn lỗi Linux. Jones nhận thấy rằng Linux 6.4 có một lỗi có nghĩa là nó sẽ bị treo khi khởi động khoảng 1 trên 1.000 lần. Jones bắt đầu xác định chính xác lỗi và chứng minh rằng anh ấy đã bắt được nó một cách thuận lợi. Tuy nhiên, công việc gây chú ý của anh ấy, liên quan đến việc khởi động Linux 292.612 lần (và 1.000 lần khác để xác nhận lỗi) dường như “chỉ mất 21 giờ”. Có vẻ như lỗi này ít phổ biến hơn với phần cứng Intel so với các máy dựa trên AMD.

Jones lần đầu tiên phát hiện ra lỗi khởi động Linux khó nắm bắt nhưng có thể sao chép này khi một số phần mềm máy chủ kiểm tra nbdkit (một giao thức để truy cập các thiết bị khối qua mạng) dường như bị “treo ngẫu nhiên” khi được sử dụng với libguestsfs (một công cụ để truy cập và sửa đổi máy ảo hình ảnh đĩa.) Mặc dù chúng tôi biết rằng giai đoạn thử nghiệm vòng lặp chỉ dài 21 giờ (mặc dù đã có 293.612 quá trình khởi động thiên văn được bắt đầu) Jones nói rằng để đạt được điểm này “mất nhiều ngày”. Nhà phát triển Linux kể lại rằng sự chia đôi đau đớn giữa Linux v6.0 và v6.4-rc6 đã giúp anh ta thu hẹp thủ phạm treo khởi động. Thủ phạm đó được cho là hồi quy trong tính năng thời gian printk. Jones khẳng định rằng việc hoàn nguyên cam kết mã này sẽ “khắc phục sự cố”.

Chia sẻ cho bạn bè cùng đọc