AMD Ryzen 7000 bị cháy: Đã xác định được nguyên nhân gốc rễ, đổ lỗi cho điện áp EXPO và SoC

AMD

(Nguồn: Speedrookie/Reddit)

Nhiều báo cáo về việc bộ xử lý Ryzen bị cháy đã xuất hiện trên internet trong vài ngày qua. Các con chip bị hư hỏng không chỉ phình ra và quá nóng đến mức chúng bị hàn lại mà còn gây ra thiệt hại đáng kể cho các bo mạch chủ mà chúng được lắp vào. Chúng tôi đã liên hệ với những người liên hệ trong ngành và biết được một số thông tin mới về bản chất của sự cố. vấn đề và phạm vi khắc phục theo kế hoạch của AMD. Thông tin của chúng tôi đến từ nhiều nguồn muốn ẩn danh, nhưng thông tin từ các nguồn của chúng tôi phù hợp với tất cả các chi tiết kỹ thuật chính.

Đầu tiên, điều quan trọng cần biết là tình trạng này có thể xảy ra với cả mẫu Ryzen 7000 tiêu chuẩn và chip Ryzen 7000X3D mới, mặc dù loại sau nhạy cảm hơn nhiều với tình trạng này và nguyên nhân gốc rễ có thể khác nhau giữa hai loại chip. AMD sẽ sớm đưa ra bản sửa lỗi nhưng chưa rõ thời gian. Chúng tôi được biết rằng lỗi đã xảy ra với tất cả các thương hiệu bo mạch chủ, bao gồm Biostar, ASUS, MSI, Gigabyte và ASRock.

Theo các nguồn tin của chúng tôi và được hỗ trợ bởi một tuyên bố của ASUS với Der8auer, vấn đề bắt nguồn từ việc điện áp SoC bị thay đổi thành mức cao hơn không an toàn. Điều này có thể được áp đặt từ điện áp được lập trình sẵn được sử dụng trong cấu hình ép xung bộ nhớ EXPO hoặc khi người dùng điều chỉnh điện áp SoC theo cách thủ công (một phương pháp phổ biến để tăng thêm một chút khoảng trống cho ép xung bộ nhớ).

Các nguồn tin của chúng tôi cũng bổ sung thêm chi tiết về bản chất của lỗi chip — trong một số trường hợp, điện áp SoC quá cao sẽ phá hủy cảm biến nhiệt và cơ chế bảo vệ nhiệt của chip, vô hiệu hóa hoàn toàn phương tiện phát hiện và bảo vệ duy nhất của chip khỏi quá nhiệt. Kết quả là con chip tiếp tục hoạt động mà không biết nhiệt độ của nó.

Các chip hiện đại của AMD thường chạy ở giới hạn nhiệt để vắt kiệt từng giọt hiệu suất cuối cùng trong phạm vi nhiệt an toàn của chúng — không có gì lạ khi chúng chạy ở 95C trong quá trình hoạt động bình thường — vì vậy chúng sẽ tự động tiếp tục tiêu thụ nhiều năng lượng hơn cho đến khi nó quay số trở lại để duy trì trong một nhiệt độ an toàn. Trong trường hợp này, việc thiếu cảm biến nhiệt độ và cơ chế bảo vệ cho phép chip nhận được nhiều năng lượng hơn vượt quá giới hạn an toàn được khuyến nghị. Việc tiêu thụ điện năng quá mức này dẫn đến hiện tượng quá nhiệt, cuối cùng gây ra hư hỏng vật lý cho chip, chẳng hạn như hiện tượng cong vênh mà chúng tôi đã thấy ở bên ngoài một số gói chip hoặc hiện tượng giảm hàn được báo cáo bởi Der8auer.

Con chip nhận được dòng điện quá mức thông qua ổ cắm bo mạch chủ trong vòng xoáy tử thần này, do đó dẫn đến hư hỏng có thể nhìn thấy mà chúng ta có thể thấy ở ổ cắm tới các chân vCore và chỗ phồng lên trên các miếng đệm LGA của chip. Tuy nhiên, thiệt hại ít nhìn thấy hơn cũng kéo dài đến các đường ray/chân CPU SoC, CPU_VDDCR_SOC và CPU VDD MSIC — chúng chỉ không kéo đủ dòng điện để lại vết cháy xém có thể nhìn thấy như chúng ta thấy với các chân vCore.

AMD

(Nguồn: Enwyi/Reddit)

Chúng tôi biết rằng 1,25V là giới hạn điện áp SoC an toàn được khuyến nghị và chúng tôi được biết rằng 1,4V trở lên chắc chắn làm tăng khả năng của điều kiện xảy ra. Rõ ràng, việc chạy vượt quá 1,4V không đảm bảo rằng chip của bạn sẽ bị cháy, nhưng tỷ lệ cược của bạn sẽ tăng lên. Ngược lại, 1,35V dường như là “an toàn”. Tiến hành rủi ro của riêng bạn, mặc dù.

Các nguồn tin của chúng tôi cho biết AMD đang nghiên cứu một bản sửa lỗi bao gồm giới hạn điện áp hoặc khóa phần sụn/SMU, điều này sẽ ngăn cấu hình bộ nhớ EXPO và các thao tác BIOS đơn giản vượt quá giới hạn chưa được xác định. Chúng tôi cũng được thông báo rằng AMD không thể ngăn chặn hoàn toàn việc thao túng điện áp SoC vì lượng điện áp cung cấp cho chip được quyết định bởi VRM, để lại một phương tiện cho các nhà cung cấp bo mạch chủ xảo quyệt cho phép thay đổi điện áp bất chấp sự khóa của AMD (đây không phải là lần đầu tiên các nhà cung cấp bo mạch chủ đã phá vỡ các giới hạn để cung cấp các chức năng hiếm có).

Một số nhà cung cấp bo mạch chủ, như ASUS và MSI, đã phát hành BIOS mới để khắc phục một số vấn đề. Tuy nhiên, chúng tôi đã xác nhận rằng các lỗi cũng đã xảy ra trên các bo mạch Biostar, ASRock và Gigabyte, vì vậy tất cả các nhà cung cấp đều bị ảnh hưởng ở một mức độ nào đó.

Như với tất cả các hình thức ép xung, mọi hư hỏng do sử dụng cấu hình ép xung EXPO sẽ không được bảo hành, nhưng trong tình huống này, chúng tôi không nghĩ rằng AMD hoặc nhà cung cấp bo mạch chủ sẽ lợi dụng việc thiếu hỗ trợ EXPO được bảo hành để làm mất hiệu lực bảo hành.

AMD

(Nguồn: LT-Cc/Baidu)

Hiệu suất được quảng cáo mà bạn nhận được từ cấu hình EXPO cũng không được nhà sản xuất chip đảm bảo. Cũng cần lưu ý rằng giới hạn điện áp SoC được lên kế hoạch có chủ đích của AMD có thể dẫn đến tần số ép xung bộ nhớ ổn định thấp hơn. Tuy nhiên, chúng tôi không nghĩ rằng điều đó sẽ quá quan trọng đối với hầu hết chủ sở hữu Ryzen 7000, vì điểm hấp dẫn DDR5-6000 chỉ hoạt động tốt trong giới hạn đề xuất. Tuy nhiên, những người ép xung cực đoan và những người muốn đạt đến đỉnh cao về hiệu năng có thể phải chịu giới hạn ép xung thấp hơn. Thời gian sẽ trả lời.

Chia sẻ cho bạn bè cùng đọc