Phòng thí nghiệm quốc gia Argonne và Intel đã công bố vào thứ Năm rằng việc lắp đặt 10.624 cánh quạt cho siêu máy tính Aurora đã được hoàn thành và hệ thống sẽ hoạt động vào cuối năm 2023. Máy sử dụng hàng chục nghìn bộ xử lý Xeon Max ‘Sapphire Rapids’ với bộ nhớ HBM2E cũng như hàng chục nghìn GPU tính toán GPU Max ‘Ponte Vecchio’ của Trung tâm dữ liệu để đạt được hiệu suất trên 2 FP64 ExaFLOPS.
Siêu máy tính Aurora do HPE chế tạo bao gồm 166 giá đỡ với 64 lưỡi trên mỗi giá, với tổng số 10.624 lưỡi. Mỗi phiến Aurora dựa trên hai CPU Xeon Max với bộ nhớ HBM2E 64 GB đi kèm cũng như sáu GPU điện toán Intel Data Center Max ‘Ponte Vecchio’. Các CPU và GPU này sẽ được làm mát bằng hệ thống làm mát bằng chất lỏng tùy chỉnh.
Tổng cộng, siêu máy tính Aurora có 21.248 CPU đa năng với hơn 1,1 triệu lõi hiệu suất cao, 19,9 petabyte (PB) bộ nhớ DDR5, 1,36 PB bộ nhớ HBM2E được gắn vào CPU và 63.744 GPU điện toán được thiết kế cho khối lượng công việc AI và HPC song song lớn với 8,16 PB bộ nhớ HBM2E tích hợp. Các cánh được kết nối với nhau bằng vải Slingshot của HPE được thiết kế dành riêng cho siêu máy tính.
Jeff McVeigh, phó chủ tịch tập đoàn Intel và tổng giám đốc của Super Compute Group cho biết: “Aurora là lần đầu tiên triển khai GPU Max Series của Intel, hệ thống dựa trên CPU Xeon Max lớn nhất và cụm GPU lớn nhất trên thế giới. “Chúng tôi tự hào là một phần của hệ thống lịch sử này và rất hào hứng với AI, khoa học và kỹ thuật đột phá mà Aurora sẽ cho phép.”
Siêu máy tính Aurora sử dụng một dãy 1.024 nút lưu trữ bao gồm các thiết bị lưu trữ thể rắn và cung cấp dung lượng 220TB cũng như tổng băng thông 31 TB/giây, sẽ thuận tiện cho việc xử lý khối lượng công việc liên quan đến bộ dữ liệu lớn, chẳng hạn như nghiên cứu phản ứng tổng hợp hạt nhân, kỹ thuật khoa học, mô phỏng vật lý, nghiên cứu chữa bệnh, dự báo thời tiết và các nhiệm vụ khác.
Mặc dù quá trình cài đặt các cánh quạt Aurora đã hoàn tất nhưng siêu máy tính vẫn chưa vượt qua thử nghiệm nghiệm thu. Khi nó hoạt động và ra mắt vào cuối năm nay, nó hứa hẹn sẽ đạt hiệu suất cao nhất về mặt lý thuyết vượt quá 2 ExaFLOPS, khiến nó trở thành siêu máy tính đầu tiên đạt được mức hiệu suất này khi tham gia vào danh sách Top500.
Rick Stevens, phó giám đốc phòng thí nghiệm của Phòng thí nghiệm quốc gia Argonne cho biết: “Trong khi chúng tôi hướng tới thử nghiệm chấp nhận, chúng tôi sẽ sử dụng Aurora để huấn luyện một số mô hình AI tạo ra nguồn mở quy mô lớn cho khoa học”. “Aurora, với hơn 60.000 GPU Intel Max, hệ thống I/O rất nhanh và hệ thống lưu trữ dung lượng lớn hoàn toàn ở trạng thái rắn, là môi trường hoàn hảo để đào tạo những mô hình này.”
Trong khi siêu máy tính Aurora chưa vượt qua các bài kiểm tra và ANL chưa gửi kết quả hoạt động của nó lên Top500.org, Intel đã có cơ hội chia sẻ những lợi thế về hiệu suất mà phần cứng của họ có được so với các giải pháp cạnh tranh từ AMD và Nvidia.
Theo Intel, các thử nghiệm sơ bộ với GPU Max Series cho thấy chúng vượt trội trong ‘khối lượng công việc khoa học và kỹ thuật trong thế giới thực’, mang lại hiệu suất cao gấp đôi so với GPU AMD Instinct MI250X trên OpenMC và có thể mở rộng gần như hoàn hảo trên hàng trăm nút. Ngoài ra, Intel cho biết CPU Intel Xeon Max Series của họ mang lại hiệu suất cao hơn 40% so với các đối thủ trong nhiều ứng dụng HPC trong thế giới thực, bao gồm HPCG, NEMO-GYRE, Anerlastic Wave Propagation, BlackScholes và OpenFOAM.