AMD Instinct MI300 Chi tiết xuất hiện, ra mắt trong 2 siêu máy tính Exaflop El Capitan

MI300

(Nguồn: Marco Chiappetta)

Bản năng MI300 của AMD đang được định hình là một con chip đáng kinh ngạc với các lõi CPU và GPU và một khối bộ nhớ tốc độ cao khổng lồ được kết hợp với nhau trên cùng một bộ xử lý, nhưng các chi tiết vẫn còn ít. Giờ đây, chúng tôi đã thu thập một số thông tin chi tiết mới từ bài thuyết trình về Siêu máy tính quốc tế (ISC) 2023, trong đó phác thảo siêu máy tính El Capitan hai exaflop sắp ra mắt sẽ được cung cấp bởi Instinct MI300. Chúng tôi cũng tìm thấy các chi tiết khác trong bài phát biểu quan trọng của CTO Mark Papermaster của AMD tại ITF World 2023, một hội nghị do gã khổng lồ nghiên cứu imec tổ chức (bạn có thể đọc cuộc phỏng vấn của chúng tôi với Papermaster tại đây).

Siêu máy tính El Capitan sẵn sàng trở thành siêu máy tính nhanh nhất thế giới khi nó hoạt động vào cuối năm 2023, chiếm vị trí dẫn đầu từ Frontier do AMD cung cấp. Instinct MI300 mạnh mẽ của AMD sẽ cung cấp năng lượng cho máy và các chi tiết mới bao gồm bản đồ cấu trúc liên kết cài đặt MI300, hình ảnh về phòng thí nghiệm Austin MI300 của AMD và hình ảnh về các cánh quạt mới sẽ được sử dụng trong siêu máy tính El Capitan. Chúng tôi cũng sẽ đề cập đến một số diễn biến mới khác xung quanh việc triển khai El Capitan.

Xin nhắc lại, Instinct MI300 là một APU trung tâm dữ liệu kết hợp tổng cộng 13 bộ ba, nhiều bộ ba trong số đó được xếp chồng lên nhau 3D, để tạo ra một gói chip duy nhất với 24 lõi CPU Zen 4 được hợp nhất với công cụ đồ họa CDNA 3 và tám bộ nhớ HBM3 với tổng dung lượng 128GB. Nhìn chung, con chip này nặng tới 146 tỷ bóng bán dẫn, khiến nó trở thành con chip lớn nhất mà AMD đưa vào sản xuất. Chín khuôn điện toán, là sự kết hợp giữa CPU và GPU 5nm, được xếp chồng lên nhau 3D trên bốn khuôn nền 6nm, là các bộ xen kẽ hoạt động xử lý bộ nhớ và lưu lượng I/O, cùng các chức năng khác.

Bài phát biểu quan trọng về ITF World của Papermaster tập trung vào mục tiêu “30×25” của AMD nhằm tăng hiệu quả sử dụng năng lượng lên gấp 30 lần vào năm 2025 và cách điện toán hiện đang bị kiểm soát bởi hiệu quả sử dụng năng lượng khi Định luật Moore chậm lại. Chìa khóa cho sáng kiến ​​đó là Instinct MI300 và phần lớn lợi ích của nó đến từ cấu trúc liên kết hệ thống được đơn giản hóa mà bạn thấy ở trên.

Như bạn có thể thấy trong trang trình bày đầu tiên, một nút được hỗ trợ bởi Instinct MI250 có các CPU và GPU riêng biệt, với một CPU EPYC duy nhất ở giữa để điều phối khối lượng công việc.

Ngược lại, Instinct MI300 chứa bộ xử lý EPYC Genoa thế hệ thứ tư 24 lõi tích hợp bên trong gói, do đó loại bỏ một CPU độc lập khỏi phương trình. Tuy nhiên, cấu trúc liên kết tổng thể vẫn giữ nguyên, loại bỏ CPU độc lập, cho phép cấu trúc liên kết tất cả với tất cả được kết nối đầy đủ với bốn phần tử. Loại kết nối này cho phép tất cả các bộ xử lý nói chuyện trực tiếp với nhau mà không cần CPU hoặc GPU khác đóng vai trò trung gian để chuyển tiếp dữ liệu đến các phần tử khác, do đó giảm độ trễ và độ biến thiên. Đó là một điểm khó khăn tiềm ẩn với cấu trúc liên kết MI250. Bản đồ cấu trúc liên kết MI300 cũng chỉ ra rằng mỗi chip có ba kết nối, giống như chúng ta đã thấy với MI250. Các trang trình bày của Papermaster cũng đề cập đến các bộ xen kẽ tích cực tạo thành khuôn đế là ‘khuôn đế vải vô cực thế hệ thứ tư.”

Như bạn có thể thấy trong phần còn lại của các slide này, MI300 đã đặt AMD trên con đường rõ ràng để vượt mục tiêu hiệu quả 30X25 đồng thời vượt xa xu hướng sức mạnh của ngành. Chúng tôi cũng đã đưa vào một số hình ảnh về silicon Instinct MI300 mà chúng tôi đã tận mắt nhìn thấy, nhưng bên dưới, chúng tôi sẽ xem MI300 trông như thế nào bên trong một lưỡi dao thực tế sẽ được lắp đặt ở El Capitan.

Bản năng AMD MI300 ở El Capitan

Chia sẻ cho bạn bè cùng đọc