Trong thời gian diễn ra Computex 2023, tôi đã có cơ hội đến thăm các văn phòng cao chót vót của AMD ở Đài Bắc, Đài Loan, để xem bản demo Ryzen AI của công ty và nói chuyện với David McAfee, Phó chủ tịch công ty kiêm Giám đốc điều hành của Kênh kinh doanh khách hàng. Hầu hết cuộc trò chuyện của chúng tôi tập trung vào những nỗ lực của AMD trong lĩnh vực AI dành cho người tiêu dùng, nhưng tôi cũng hỏi một số câu hỏi về việc AMD sử dụng CPU lai. McAfee nói với tôi rằng AMD có tầm nhìn khác về bộ xử lý lai so với Intel để tránh sự phức tạp đã buộc Intel phải loại bỏ hỗ trợ AVX-512 khỏi chip của mình.
Tôi đã phỏng vấn AMD CTO Mark Papermaster hai tuần trước tại Antwerp, Bỉ. Anh ấy nói với tôi rằng chúng ta sẽ “thấy các lõi hiệu năng cao kết hợp với các lõi tiết kiệm năng lượng kết hợp với khả năng tăng tốc” trong máy khách AMD trong tương lai [consumer] bộ xử lý, báo hiệu rằng, giống như Intel trước đó, AMD sẽ áp dụng thiết kế lõi thực thi CPU lai trong tương lai. Điều đó không quá ngạc nhiên — chúng tôi đã thấy những dấu hiệu đầu tiên của hai loại lõi CPU khác nhau trong sách hướng dẫn sử dụng phần mềm của AMD vài tháng trước. Bên cạnh đó, AMD đã đặt nền móng cho chip EPYC Bergamo sắp ra mắt với lõi Zen 4c dày đặc giống như lõi hiệu suất.
Các chip máy tính xách tay Ryzen 7040 hiện tại của AMD đã có thiết kế lai, nhưng không có hai loại lõi CPU khác nhau. Thay vào đó, Ryzen 7040 chỉ có một loại lõi CPU được ghép nối với một công cụ tăng tốc AI tích hợp hoạt động độc lập với lõi CPU và GPU. Công cụ này mang lại lợi thế cho một số loại khối lượng công việc suy luận AI nhất định, nhưng lõi CPU và GPU sẽ tốt hơn cho các loại suy luận khác. Vì vậy, mẹo là hướng các khối lượng công việc AI khác nhau đến đúng loại lõi để đạt được hiệu suất và hiệu suất năng lượng tốt nhất.
Việc đưa các lõi CPU hiệu suất và hiệu suất riêng biệt vào hỗn hợp đó sẽ giới thiệu thêm một tùy chọn điện toán khác cho khối lượng công việc suy luận AI và tôi đã hỏi McAfee rằng liệu về mặt khái niệm, liệu các lõi hiệu suất có tốt hơn cho AI so với một miếng silicon chuyên dụng hay không (AI động cơ). McAfee giải thích rằng sự tập trung nghiêm ngặt của công cụ AI vào các hoạt động dành riêng cho AI sẽ mang lại cho nó lợi thế về hiệu quả so với bất kỳ máy tính CPU đa năng nào — thậm chí là lõi hiệu quả.
Sau đó, chúng tôi chuyển sang thảo luận về chip lai của Intel, loại chip này có hai loại lõi, mỗi loại có cấu trúc vi mô độc đáo của riêng nó. Điều đó đã tạo ra những vấn đề thú vị: lõi hiệu suất của Intel hỗ trợ AVX-512, nhưng lõi hiệu suất nhỏ hơn thì không. Điều đó khiến Intel vô hiệu hóa hoàn toàn hỗ trợ AVX-512 (cuối cùng là cưỡng bức), do đó loại bỏ tính năng của chip riêng và lãng phí diện tích khuôn quý giá.
Tôi đã hỏi McAfee rằng AMD cảm thấy thế nào về cách tiếp cận thiết kế lai đó.
McAfee trả lời: “Điều tôi sẽ nói là, tôi nghĩ cách chúng ta nghĩ về nó, cách tiếp cận của hai lõi hiệu suất và hiệu quả rất khác nhau với khả năng và hỗ trợ ISA và IPC rất khác nhau không nhất thiết phải là cách tiếp cận đúng đắn”. “Tôi nghĩ rằng nó tạo ra sự phức tạp hơn nhiều xung quanh những gì có thể thực hiện ở đâu và khi chúng tôi xem xét các tùy chọn khác nhau cho thiết kế cốt lõi, đó không phải là cách tiếp cận mà chúng tôi đang thực hiện.
“Tôi nghĩ rằng khi chúng tôi triển khai thêm tính năng này theo thời gian, những gì bạn sẽ thấy từ chúng tôi là một cách tiếp cận có tính đến những lợi thế mà các nhắm mục tiêu cốt lõi khác nhau có thể mang lại, nhưng thực hiện theo cách còn nhiều hơn thế nữa, từ góc độ ứng dụng , đồng nhất hơn nhiều.”
Chúng tôi đã biết rằng các lõi hiệu suất Zen 4C của AMD, mà nó sẽ sử dụng trong các chip máy chủ Bergamo sắp tới, sẽ hỗ trợ các hướng dẫn tương tự, như AVX-512, như các lõi hiệu suất đầy đủ tính năng. Tuy nhiên, chúng sẽ có một hệ thống phân cấp bộ nhớ cache được cắt giảm để giảm mức tiêu thụ diện tích khuôn. Mục tiêu của cả hai loại lõi có cùng IPC với lõi hiệu năng và hiệu quả là rất quan trọng. Ngược lại, lõi hiệu quả của Intel có IPC thấp hơn so với lõi hiệu suất của nó (điều này có thể dẫn đến sự đánh đổi trong các nguyện vọng lõi điện tử khác của họ, như Sierra Forest).
McAfee cho biết: “Trước hết, ISA giữ cho khối lượng công việc có thể hoạt động trên bất kỳ lõi nào nhất quán, có những lợi thế đáng kể”. “Và ngay cả khi bạn nhìn vào CPU máy tính để bàn Ryzen ngày nay, cách mà bộ lập lịch Windows hoạt động, khả năng xác định các lõi nhanh hơn, chậm hơn, v.v. và điều khiển các luồng đến các lõi khác nhau tùy thuộc vào thứ hạng hoặc khả năng trong một CPU; Đó là một kỹ thuật đã được thiết lập tốt mà chúng tôi đã sử dụng trong một thời gian dài. Theo ý kiến của chúng tôi, điều này dẫn đến việc sử dụng một cơ chế trong đó khả năng của các lõi nhất quán hơn.
“Đây là một cách đúng đắn và đã được thử nghiệm nhiều hơn để xem xét việc đưa nhiều loại nhắm mục tiêu cốt lõi khác nhau vào một thiết kế. Tôi nghĩ rằng phương pháp của Intel tạo ra rất nhiều phức tạp trong cách thức hoạt động của nó. Và tôi nghĩ rằng phân tích của chúng tôi đã đúng như vậy. Tôi đừng nghĩ rằng bạn sẽ thấy chúng tôi đi theo con đường đó giống như cách họ đã làm, nếu và khi nói đến bộ xử lý Ryzen.” McAfee kết luận.
Không giống như Papermaster, McAfee không phổ biến về việc liệu lai sẽ đến với Ryzen hay không và khi nào thì AMD sẽ giới thiệu kiến trúc lai với Ryzen lần đầu tiên ở đâu, có thể là với APU nguyên khối hoặc một trong các mẫu dựa trên chiplet của nó. Tuy nhiên, rõ ràng là AMD đã hình dung ra một tương lai lai có thể tránh được những đánh đổi mà chúng ta đã thấy với các quyết định thiết kế của Intel đằng sau bộ xử lý Alder và Raptor Lake.
Một số quyết định riêng của AMD có thể được thông báo bằng cách phân tích những sai lầm của Intel hoặc có thể đó chỉ là ý thức chung về việc sử dụng lại IP với kiến trúc lõi hiện có – đó là một bước tiến nhẹ hơn nhiều để điều chỉnh một kiến trúc vi mô hơn là bắt tay vào thiết kế sạch sẽ. Trong cả hai trường hợp, khả năng duy trì hỗ trợ cho AVX-512 có thể sẽ mang lại cho AMD lợi thế về hiệu suất trong khối lượng công việc được vector hóa, miễn là Intel không làm theo.
Ngược lại, người ta có thể lập luận rằng cách tiếp cận của Intel về việc có một vi kiến trúc riêng biệt được điều chỉnh để hoạt động ở mức năng lượng thấp hơn là một cách tiếp cận tốt hơn, mặc dù nếu nó được ghép nối với sự hỗ trợ ISA thống nhất trên cả hai loại lõi. Nếu Intel đã sửa lỗi ISA của mình không phù hợp với Meteor Lake và duy trì hỗ trợ cho AVX-512 trên cả hai loại lõi, thì đó cũng có thể chứng tỏ là một sự kết hợp mạnh mẽ.
Trong cả hai trường hợp, rõ ràng là mặc dù AMD sẽ đứng thứ hai trên thị trường với thiết kế lai, nhưng nó sẽ có một cách tiếp cận khác. Chỉ có thời gian mới cho biết hai kỹ thuật này xếp chồng lên nhau như thế nào trong các điểm chuẩn.