Intel nói về Falcon Shores Flub, hợp nhất lộ trình Habana Gaudi

Ban đầu, Intel đã lên kế hoạch cho các chip Falcon Shores của mình có cả lõi GPU và CPU bên trong, tạo ra ‘XPU’ đầu tiên của công ty dành cho điện toán hiệu năng cao. Tuy nhiên, thông báo bất ngờ cách đây vài tháng rằng họ sẽ chuyển sang thiết kế chỉ có GPU và trì hoãn sản xuất chip đến năm 2025 đã khiến các nhà quan sát trong ngành bị sốc — điều này khiến Intel không thể cạnh tranh với bộ xử lý Instinct MI300 của AMD và bộ xử lý Grace Hopper của Nvidia, cả hai đều có tính năng kết hợp. Thiết kế CPU + GPU.

Hôm nay, Intel đã cung cấp một số lý do có phần đáng ngờ đằng sau quyết định cắt giảm các kế hoạch của mình đối với Falcon Shores để biến nó thành sản phẩm kế thừa duy nhất GPU cho dòng GPU Xeon Max. Intel cũng đã phác thảo một số chi tiết ban đầu về thiết kế Falcon Shores chỉ dành cho GPU mới của mình, mà chúng tôi sẽ đề cập sâu hơn bên dưới.

Intel cũng đã ban hành một lộ trình HPC và AI mới không cho thấy sự kế thừa của bộ xử lý Gaudi3 — thay vào đó, Gaudi và GPU hợp nhất với GPU Falcon Shores khi nó tiếp quản chip HPC và AI ra mắt của Intel. Intel nói với chúng tôi rằng họ ‘có kế hoạch tích hợp sản phẩm Habana và AXG [GPU] lộ trình,’ nhưng các chi tiết của sự tích hợp là rất ít.

Kiến trúc điện toán Gaudi thay đổi đáng kể so với GPU tiêu chuẩn, do đó, có vẻ như kiến ​​trúc điện toán của nó không thể được tích hợp hoàn toàn vào GPU. Do đó, Intel có thể kết hợp các phần nhỏ hơn của thiết kế Gaudi, như giao diện mạng hoặc các khối IP khác, vào GPU của mình. Chúng tôi được biết rằng Jeff McVeigh, Phó chủ tịch kiêm Tổng giám đốc của Nhóm Máy tính tăng tốc của Intel, sẽ cung cấp thêm thông tin chi tiết vào hôm nay. Xin nhắc lại, Intel đã trả 2 tỷ đô la cho Habana Labs và loại bỏ các sản phẩm từ thương vụ mua lại Nervana trị giá 350 triệu đô la để tập trung vào chip Gaudi.

bờ biển chim ưng

(Nguồn: Intel)

Intel đã chia sẻ một số chi tiết cơ bản về thiết kế Falcon Shores mới, thiết kế này sẽ tiếp tục tập trung vào khối lượng công việc HPC và AI nhưng sẽ sử dụng lõi GPU. Các XPU Falcon Shores tập trung vào HPC được thiết kế cho các ứng dụng siêu máy tính với kế hoạch hợp nhất cả công nghệ CPU và GPU thành một gói chip kết hợp và kết hợp, nhưng giờ đây chúng sẽ xuất hiện lần đầu tiên dưới dạng kiến ​​trúc chỉ GPU vào năm 2025.

Falcon Shores sẽ sử dụng chuyển mạch ethernet tiêu chuẩn, giống như kiến ​​trúc Gaudi tập trung vào AI của Intel, dung lượng bộ nhớ HBM3 không xác định và “I/O được thiết kế để mở rộng quy mô”, có khả năng cho thấy rằng Falcon Shores sẽ đi kèm với các tùy chọn dung lượng bộ nhớ khác nhau. Intel nói rằng Falcon sẽ đi kèm với HBM3 lên tới 288GB và tổng thông lượng bộ nhớ là 9,8 TB/s. Theo dự kiến, nó sẽ hỗ trợ các loại dữ liệu nhỏ hơn, như FP8 và BF16.

Bản phác thảo cơ bản của thiết bị cũng bao gồm giao diện lập trình dựa trên GPU phổ biến, OneAPI, cho phép khả năng tương thích rộng rãi với các CPU và kiến ​​trúc khác. Intel cũng liệt kê hỗ trợ CXL như một điểm khác biệt chính, điều này đưa chúng ta đến lý do đằng sau việc lấy các lõi CPU khỏi gói Falcon Shores.

bờ biển chim ưng

(Nguồn: Intel)

Intel nói rằng mục tiêu ban đầu của họ là kết hợp các lõi CPU và GPU vào cùng một gói Falcon Shores là quá sớm. Như được hiển thị trong slide trên, Intel nói rằng sự kết hợp tối ưu giữa lõi CPU và GPU đã thay đổi theo thời gian khi khối lượng công việc phát triển và công ty mong đợi những thay đổi nhanh chóng và triệt để hơn đối với tỷ lệ CPU/GPU tối ưu sẽ xảy ra cùng với sự bùng nổ của AI và LLM tổng hợp vào không gian HPC. Do đó, Intel cho biết họ không cảm thấy đã đến lúc phải khóa khách hàng vào các tỷ lệ CPU và GPU cụ thể.

Chia sẻ cho bạn bè cùng đọc