Bản năng MI300 của AMD đang được định hình là một con chip đáng kinh ngạc với các lõi CPU và GPU và một khối bộ nhớ tốc độ cao khổng lồ được kết hợp với nhau trên cùng một bộ xử lý, nhưng các chi tiết vẫn còn ít. Giờ đây, chúng tôi đã thu thập một số thông tin chi tiết mới từ bài thuyết trình về Siêu máy tính quốc tế (ISC) 2023, trong đó phác thảo siêu máy tính El Capitan hai exaflop sắp ra mắt sẽ được cung cấp bởi Instinct MI300. Chúng tôi cũng tìm thấy các chi tiết khác trong bài phát biểu quan trọng của CTO Mark Papermaster của AMD tại ITF World 2023, một hội nghị do gã khổng lồ nghiên cứu imec tổ chức (bạn có thể đọc cuộc phỏng vấn của chúng tôi với Papermaster tại đây).
Siêu máy tính El Capitan sẵn sàng trở thành siêu máy tính nhanh nhất thế giới khi nó hoạt động vào cuối năm 2023, chiếm vị trí dẫn đầu từ Frontier do AMD cung cấp. Instinct MI300 mạnh mẽ của AMD sẽ cung cấp năng lượng cho máy và các chi tiết mới bao gồm bản đồ cấu trúc liên kết cài đặt MI300, hình ảnh về phòng thí nghiệm Austin MI300 của AMD và hình ảnh về các cánh quạt mới sẽ được sử dụng trong siêu máy tính El Capitan. Chúng tôi cũng sẽ đề cập đến một số diễn biến mới khác xung quanh việc triển khai El Capitan.
Xin nhắc lại, Instinct MI300 là một APU trung tâm dữ liệu kết hợp tổng cộng 13 bộ ba, nhiều bộ ba trong số đó được xếp chồng lên nhau 3D, để tạo ra một gói chip duy nhất với 24 lõi CPU Zen 4 được hợp nhất với công cụ đồ họa CDNA 3 và tám bộ nhớ HBM3 với tổng dung lượng 128GB. Nhìn chung, con chip này nặng tới 146 tỷ bóng bán dẫn, khiến nó trở thành con chip lớn nhất mà AMD đưa vào sản xuất. Chín khuôn điện toán, là sự kết hợp giữa CPU và GPU 5nm, được xếp chồng lên nhau 3D trên bốn khuôn nền 6nm, là các bộ xen kẽ hoạt động xử lý bộ nhớ và lưu lượng I/O, cùng các chức năng khác.
Bài phát biểu quan trọng về ITF World của Papermaster tập trung vào mục tiêu “30×25” của AMD nhằm tăng hiệu quả sử dụng năng lượng lên gấp 30 lần vào năm 2025 và cách điện toán hiện đang bị kiểm soát bởi hiệu quả sử dụng năng lượng khi Định luật Moore chậm lại. Chìa khóa cho sáng kiến đó là Instinct MI300 và phần lớn lợi ích của nó đến từ cấu trúc liên kết hệ thống được đơn giản hóa mà bạn thấy ở trên.
Như bạn có thể thấy trong trang trình bày đầu tiên, một nút được hỗ trợ bởi Instinct MI250 có các CPU và GPU riêng biệt, với một CPU EPYC duy nhất ở giữa để điều phối khối lượng công việc.
Ngược lại, Instinct MI300 chứa bộ xử lý EPYC Genoa thế hệ thứ tư 24 lõi tích hợp bên trong gói, do đó loại bỏ một CPU độc lập khỏi phương trình. Tuy nhiên, cấu trúc liên kết tổng thể vẫn giữ nguyên, loại bỏ CPU độc lập, cho phép cấu trúc liên kết tất cả với tất cả được kết nối đầy đủ với bốn phần tử. Loại kết nối này cho phép tất cả các bộ xử lý nói chuyện trực tiếp với nhau mà không cần CPU hoặc GPU khác đóng vai trò trung gian để chuyển tiếp dữ liệu đến các phần tử khác, do đó giảm độ trễ và độ biến thiên. Đó là một điểm khó khăn tiềm ẩn với cấu trúc liên kết MI250. Bản đồ cấu trúc liên kết MI300 cũng chỉ ra rằng mỗi chip có ba kết nối, giống như chúng ta đã thấy với MI250. Các trang trình bày của Papermaster cũng đề cập đến các bộ xen kẽ tích cực tạo thành khuôn đế là ‘khuôn đế vải vô cực thế hệ thứ tư.”
Như bạn có thể thấy trong phần còn lại của các slide này, MI300 đã đặt AMD trên con đường rõ ràng để vượt mục tiêu hiệu quả 30X25 đồng thời vượt xa xu hướng sức mạnh của ngành. Chúng tôi cũng đã đưa vào một số hình ảnh về silicon Instinct MI300 mà chúng tôi đã tận mắt nhìn thấy, nhưng bên dưới, chúng tôi sẽ xem MI300 trông như thế nào bên trong một lưỡi dao thực tế sẽ được lắp đặt ở El Capitan.
Bản năng AMD MI300 ở El Capitan
Tại ISC 2023, Bronis R. de Supinski, CTO của Phòng thí nghiệm quốc gia Lawrence Livermore (LLNL), đã nói về việc tích hợp APU Instinct MI300 vào siêu máy tính El Capitan. Cơ quan An ninh Hạt nhân Quốc gia (NNSA) sẽ sử dụng El Capitan để tiếp tục sử dụng công nghệ hạt nhân cho mục đích quân sự.
Như bạn có thể thấy trong hình ảnh đầu tiên trong album trên, Supinski đã cho thấy một lưỡi kiếm duy nhất cho hệ thống El Capitan. Lưỡi dao này do nhà cung cấp hệ thống HPE sản xuất, có bốn thẻ Instinct MI300 làm mát bằng chất lỏng trong khung máy 1U mỏng. Supinksi cũng đưa ra một hình ảnh về phòng thí nghiệm Austin của AMD, nơi họ đang làm việc với silicon MI300, do đó cho thấy rằng các chip này là có thật và đang được thử nghiệm — một điểm quan trọng cần được thực hiện khi xem xét một số sai lầm gần đây với các hệ thống do Intel cung cấp.
Supinksi thường gọi MI300 là “MI300A”, nhưng chúng tôi không chắc đó là mẫu tùy chỉnh cho El Capitan hay số sản phẩm chính thức hơn.
Supinski cho biết con chip này đi kèm với Infinity Cache nhưng không chỉ định dung lượng khả dụng. Supinski cũng nhiều lần trích dẫn tầm quan trọng của một tầng bộ nhớ, lưu ý cách không gian bộ nhớ hợp nhất đơn giản hóa việc lập trình, vì nó làm giảm sự phức tạp của việc di chuyển dữ liệu giữa các loại máy tính khác nhau và các nhóm bộ nhớ khác nhau.
Supinski lưu ý rằng MI300 có thể chạy ở một số chế độ khác nhau, nhưng chế độ chính bao gồm một miền bộ nhớ duy nhất và miền NUMA, do đó cung cấp bộ nhớ truy cập thống nhất cho tất cả các lõi CPU và GPU. Điểm nổi bật quan trọng là bộ nhớ kết hợp bộ nhớ cache giúp giảm chuyển động dữ liệu giữa CPU và GPU, vốn thường tiêu thụ nhiều năng lượng hơn so với bản thân quá trình tính toán, do đó giảm độ trễ và cải thiện hiệu suất cũng như hiệu quả sử dụng năng lượng. Supinksi cũng cho biết việc chuyển mã từ siêu máy tính Sierra sang El Capitan tương đối dễ dàng.
Phần còn lại của các slide của Supinski bao gồm thông tin mà AMD đã tiết lộ, bao gồm các dự đoán hiệu suất gấp 8 lần hiệu suất AI và 5 lần hiệu suất trên mỗi watt của MI250X.
HPE đang xây dựng hệ thống El Capitan dựa trên kiến trúc Shasta và kết nối mạng Slingshot-11 của nó. Đây là cùng một nền tảng cung cấp năng lượng cho cả hai siêu máy tính exascale khác của DOE, Frontier, siêu máy tính nhanh nhất thế giới và Aurora thường bị trì hoãn được cung cấp bởi silicon của Intel.
NNSA đã phải xây dựng thêm cơ sở hạ tầng để vận hành đồng thời siêu máy tính Sierra và El Capitan. Công việc đó bao gồm tăng cường khả năng cung cấp điện dành riêng cho điện toán từ 45 MW lên 85 MW. Thêm 15 MW điện cho hệ thống làm mát đã được nâng cấp lên 28.000 tấn bằng cách bổ sung một tháp giải nhiệt 18.000 tấn mới. Điều đó mang lại cho địa điểm tổng công suất 100 MW, nhưng El Capitan dự kiến sẽ tiêu thụ dưới 40 MW, mặc dù giá trị thực tế có thể vào khoảng 30 MW — con số cuối cùng sẽ không được biết cho đến khi triển khai.
El Capitan sẽ là Hệ thống Công nghệ Tiên tiến (ATS) đầu tiên sử dụng Phần mềm Hệ điều hành Tri-lab tùy chỉnh (TOSS) của NNSA, một ngăn xếp phần mềm đầy đủ được xây dựng trên RHEL.
Chương trình lưu trữ thỏ của El Capitan
LLNL đang sử dụng các hệ thống ‘EAS3’ nhỏ hơn để chứng minh phần mềm sẽ được triển khai trên El Capitan khi nó đi vào hoạt động vào cuối năm nay. LLNL đã thử nghiệm các mô-đun Rabbit mới sẽ lưu trữ rất nhiều ổ SSD để lưu trữ cục bộ gần nút. Ở trên, bạn có thể xem sơ đồ khối của các nút này nhưng lưu ý rằng chúng không sử dụng bộ tăng tốc MI300 — thay vào đó, chúng có bộ xử lý máy chủ EPYC tiêu chuẩn cho các tác vụ phân tích dữ liệu và điều phối lưu trữ. Các nút nhanh này dường như đóng vai trò là bộ đệm liên tục hấp thụ một lượng lớn dữ liệu đến một cách nhanh chóng, sau đó dữ liệu này sẽ được chuyển sang hệ thống lưu trữ số lượng lớn chậm hơn.
Dòng thời gian MI300 của AMD Instinct
Với sự phát triển tiếp tục theo một nhịp điệu có thể dự đoán được, rõ ràng là El Capitan đang được tiến hành để đi vào hoạt động vào cuối năm nay. MI300 tạo ra một con đường mới cho các dịch vụ điện toán hiệu suất cao của AMD, nhưng AMD cho chúng tôi biết những chip MI300 xuất sắc này sẽ đắt và tương đối hiếm — đây không phải là sản phẩm có số lượng lớn, vì vậy chúng sẽ không được triển khai rộng rãi như EPYC CPU trung tâm dữ liệu Genoa. Tuy nhiên, công nghệ sẽ lọc thành nhiều biến thể ở các yếu tố hình thức khác nhau.
Con chip này cũng sẽ cạnh tranh với Siêu chip Grace Hopper của Nvidia, là sự kết hợp giữa GPU Hopper và CPU Grace trên cùng một bo mạch. Những con chip này dự kiến sẽ đến trong năm nay. Các CPU Grace dựa trên Neoverse hỗ trợ tập lệnh Arm v9 và các hệ thống đi kèm với hai chip được hợp nhất với công nghệ kết nối NVLink-C2C mới mang nhãn hiệu của Nvidia. Ngược lại, phương pháp của AMD được thiết kế để mang lại hiệu suất năng lượng và thông lượng vượt trội, vì việc kết hợp các thiết bị này thành một gói duy nhất thường cho phép thông lượng giữa các thiết bị cao hơn so với khi kết nối với hai thiết bị riêng biệt như Grace Hopper.
MI300 cũng được cho là để cạnh tranh với Falcon Shores của Intel, một con chip ban đầu được thiết kế để có một số ô tính toán khác nhau với lõi x86, lõi GPU và bộ nhớ trong nhiều cấu hình có thể. Intel gần đây đã trì hoãn chúng đến năm 2025 và xác định lại các chip chỉ có kiến trúc GPU và AI — giờ đây chúng sẽ không có lõi CPU. Trên thực tế, điều đó khiến Intel không có đối thủ cạnh tranh trực tiếp cho Instinct MI300.
Với ngày bật nguồn El Capitan đang đến rất nhanh và danh tiếng của AMD về việc hoàn thành các siêu máy tính đúng hạn, chúng ta có thể mong đợi AMD sẽ sớm bắt đầu chia sẻ nhiều thông tin hơn về các APU Instinct Mi300 của mình. AMD sẽ tổ chức sự kiện phát trực tiếp Trung tâm dữ liệu thế hệ tiếp theo và Công nghệ AI của công ty vào ngày 13 tháng 6 và chúng tôi hy vọng sẽ tìm hiểu thêm ở đó. Chúng tôi chắc chắn sẽ mang đến cho bạn thông tin mới nhất về sự kiện đó khi nó đến.