Ban đầu, Intel đã lên kế hoạch cho các chip Falcon Shores của mình có cả lõi GPU và CPU bên trong, tạo ra ‘XPU’ đầu tiên của công ty dành cho điện toán hiệu năng cao. Tuy nhiên, thông báo bất ngờ cách đây vài tháng rằng họ sẽ chuyển sang thiết kế chỉ có GPU và trì hoãn sản xuất chip đến năm 2025 đã khiến các nhà quan sát trong ngành bị sốc — điều này khiến Intel không thể cạnh tranh với bộ xử lý Instinct MI300 của AMD và bộ xử lý Grace Hopper của Nvidia, cả hai đều có tính năng kết hợp. Thiết kế CPU + GPU.
Hôm nay, Intel đã cung cấp một số lý do có phần đáng ngờ đằng sau quyết định cắt giảm các kế hoạch của mình đối với Falcon Shores để biến nó thành sản phẩm kế thừa duy nhất GPU cho dòng GPU Xeon Max. Intel cũng đã phác thảo một số chi tiết ban đầu về thiết kế Falcon Shores chỉ dành cho GPU mới của mình, mà chúng tôi sẽ đề cập sâu hơn bên dưới.
Intel cũng đã ban hành một lộ trình HPC và AI mới không cho thấy sự kế thừa của bộ xử lý Gaudi3 — thay vào đó, Gaudi và GPU hợp nhất với GPU Falcon Shores khi nó tiếp quản chip HPC và AI ra mắt của Intel. Intel nói với chúng tôi rằng họ ‘có kế hoạch tích hợp sản phẩm Habana và AXG [GPU] lộ trình,’ nhưng các chi tiết của sự tích hợp là rất ít.
Kiến trúc điện toán Gaudi thay đổi đáng kể so với GPU tiêu chuẩn, do đó, có vẻ như kiến trúc điện toán của nó không thể được tích hợp hoàn toàn vào GPU. Do đó, Intel có thể kết hợp các phần nhỏ hơn của thiết kế Gaudi, như giao diện mạng hoặc các khối IP khác, vào GPU của mình. Chúng tôi được biết rằng Jeff McVeigh, Phó chủ tịch kiêm Tổng giám đốc của Nhóm Máy tính tăng tốc của Intel, sẽ cung cấp thêm thông tin chi tiết vào hôm nay. Xin nhắc lại, Intel đã trả 2 tỷ đô la cho Habana Labs và loại bỏ các sản phẩm từ thương vụ mua lại Nervana trị giá 350 triệu đô la để tập trung vào chip Gaudi.
Intel đã chia sẻ một số chi tiết cơ bản về thiết kế Falcon Shores mới, thiết kế này sẽ tiếp tục tập trung vào khối lượng công việc HPC và AI nhưng sẽ sử dụng lõi GPU. Các XPU Falcon Shores tập trung vào HPC được thiết kế cho các ứng dụng siêu máy tính với kế hoạch hợp nhất cả công nghệ CPU và GPU thành một gói chip kết hợp và kết hợp, nhưng giờ đây chúng sẽ xuất hiện lần đầu tiên dưới dạng kiến trúc chỉ GPU vào năm 2025.
Falcon Shores sẽ sử dụng chuyển mạch ethernet tiêu chuẩn, giống như kiến trúc Gaudi tập trung vào AI của Intel, dung lượng bộ nhớ HBM3 không xác định và “I/O được thiết kế để mở rộng quy mô”, có khả năng cho thấy rằng Falcon Shores sẽ đi kèm với các tùy chọn dung lượng bộ nhớ khác nhau. Intel nói rằng Falcon sẽ đi kèm với HBM3 lên tới 288GB và tổng thông lượng bộ nhớ là 9,8 TB/s. Theo dự kiến, nó sẽ hỗ trợ các loại dữ liệu nhỏ hơn, như FP8 và BF16.
Bản phác thảo cơ bản của thiết bị cũng bao gồm giao diện lập trình dựa trên GPU phổ biến, OneAPI, cho phép khả năng tương thích rộng rãi với các CPU và kiến trúc khác. Intel cũng liệt kê hỗ trợ CXL như một điểm khác biệt chính, điều này đưa chúng ta đến lý do đằng sau việc lấy các lõi CPU khỏi gói Falcon Shores.
Intel nói rằng mục tiêu ban đầu của họ là kết hợp các lõi CPU và GPU vào cùng một gói Falcon Shores là quá sớm. Như được hiển thị trong slide trên, Intel nói rằng sự kết hợp tối ưu giữa lõi CPU và GPU đã thay đổi theo thời gian khi khối lượng công việc phát triển và công ty mong đợi những thay đổi nhanh chóng và triệt để hơn đối với tỷ lệ CPU/GPU tối ưu sẽ xảy ra cùng với sự bùng nổ của AI và LLM tổng hợp vào không gian HPC. Do đó, Intel cho biết họ không cảm thấy đã đến lúc phải khóa khách hàng vào các tỷ lệ CPU và GPU cụ thể.
Tuy nhiên, như đã trình bày ở trên, kế hoạch ban đầu cho Falcon Shores đã bao gồm khả năng điều chỉnh tỷ lệ CPU/GPU bằng cách thả một số ô CPU hoặc GPU khác nhau vào thiết kế bốn ô, do đó cho phép nó định cấu hình hỗn hợp tối ưu cho khối lượng công việc khác nhau. Bên cạnh đó, theo thiết kế, các siêu máy tính tiên tiến nhất là những thiết kế chuyên dụng cao cho nhiệm vụ hiện tại và việc điều chỉnh phần mềm cho kiến trúc chỉ đơn giản là một phần thông thường trong công việc vận hành siêu máy tính. Những yếu tố này ngụ ý rằng tỷ lệ CPU/GPU không phải là lý do duy nhất khiến Intel loại bỏ lõi CPU khỏi thiết kế.
Intel cũng chỉ ra việc cho phép khách hàng của mình sử dụng nhiều loại CPU khác nhau, hợp lý sẽ bao gồm chip x86 của AMD và chip Arm của Nvidia, với thiết kế GPU của họ, do đó không khóa khách hàng trong việc chọn lõi x86 của Intel thay vì các công ty khác. Tuy nhiên, một lần nữa, các kế hoạch ban đầu của Intel cũng bao gồm các biến thể chỉ có GPU và CPU của Falcon Shores, vì vậy lý do cơ bản này cũng có vẻ không thuyết phục.
Intel cho biết họ sẽ tận dụng giao diện CXL để cho phép khách hàng của mình tận dụng một kiến trúc có thể kết hợp, có thể kết hợp các tỷ lệ CPU/GPU khác nhau trong các thiết kế tùy chỉnh của họ. Tuy nhiên, giao diện CXL chỉ cung cấp thông lượng 64 GB/giây giữa các phần tử, trong khi các thiết kế CPU+GPU tùy chỉnh như Grace Hopper của Nvidia có thể cung cấp thông lượng bộ nhớ lên tới 1 TB/giây giữa CPU và GPU. Điều đó mang lại cả lợi thế về hiệu suất và hiệu quả so với triển khai CXL cho nhiều loại khối lượng công việc — đặc biệt là khối lượng công việc AI ngốn băng thông bộ nhớ. Đó là chưa kể đến các kết nối vốn có độ trễ thấp hơn giữa các phần tử và các lợi thế khác, chẳng hạn như mật độ hiệu suất cao hơn.
Điều đó có nghĩa là mặc dù ý tưởng của Intel về một kiến trúc có thể kết hợp tốt hơn đối với một số khối lượng công việc, nhưng nó có thể sẽ không thể cạnh tranh với MI300 của AMD hoặc Grace của Nvidia về sức mạnh, chi phí hoặc hiệu suất đối với một số ứng dụng nhất định.
Tương tự như vậy, quyết định làm chậm nhịp phát hành GPU của Intel không phải là lý tưởng vì họ sẽ phải tận dụng các sản phẩm cũ hơn để cạnh tranh với các kiến trúc tiên tiến hơn nhiều cho HPC, như Siêu chip Grace của Nvidia và APU exascale sắp ra mắt của AMD, Instinct MI300, cả hai đều ra mắt vào 2023.
Bất chấp lý do thay đổi mục tiêu của Intel, thật khó để không thấy việc Intel định nghĩa lại Falcon Shores thành một sản phẩm chỉ dành cho GPU do công ty thiếu một điểm uốn kiến trúc sẽ khiến họ gặp bất lợi trong cạnh tranh trong tương lai.