Tôi đã đến thăm văn phòng của AMD tại Đài Bắc, Đài Loan, trong thời gian diễn ra Computex 2023 để trò chuyện với David McAfee, Phó Giám đốc Công ty kiêm Tổng Giám đốc Kinh doanh Kênh Khách hàng của công ty. Cuộc trò chuyện của chúng tôi có nhiều chủ đề mà tôi sẽ viết riêng, nhưng tôi cũng có cơ hội quan sát công cụ AI Ryzen XDNA của AMD đang hoạt động trong bản demo máy tính xách tay. McAfee cũng thảo luận về các bước mà AMD đang thực hiện để chuẩn bị hệ điều hành và hệ sinh thái phần mềm cho các trường hợp sử dụng AI đang phát triển sẽ chạy cục bộ trên PC, mà chúng ta sẽ đi sâu vào bên dưới.
Sau khi lần theo bản đồ hành lang lấy cảm hứng từ mã AMD, tôi tìm đường đến phòng thử nghiệm để xem công nghệ mới nhất của AMD đang hoạt động.
Máy tính xách tay demo của AMD là Asus Strix Scar 17 được trang bị bộ vi xử lý 4nm ‘Phoenix’ Ryzen 9 7940HS của AMD kết hợp với đồ họa Radeon 780M. Những con chip 35-45W này đi kèm với kiến trúc Zen 4 và đồ họa RDNA 3. AMD cũng có một chiếc Asus ROG Zephyrus G14 chạy bản demo tương tự.
Công cụ AI XDNA, một bộ tăng tốc chuyên dụng hoạt động liên tục với các lõi CPU, là đối tượng chúng tôi quan tâm. Mục tiêu tổng thể của công cụ XDNA AI là thực thi khối lượng công việc suy luận cường độ thấp hơn, như xử lý âm thanh và video, ở mức năng lượng thấp hơn mức bạn có thể đạt được trên CPU hoặc GPU trong khi mang lại thời gian phản hồi nhanh hơn so với các dịch vụ trực tuyến, do đó tăng hiệu suất và tiết kiệm pin quyền lực.
Công cụ này có thể xử lý tối đa 4 luồng AI đồng thời, mặc dù nó có thể được cấu hình lại nhanh chóng để xử lý số lượng luồng khác nhau. AMD tuyên bố công cụ này, một sản phẩm con của Xilinx IP, nhanh hơn công cụ thần kinh có trên bộ xử lý M2 của Apple. Nó có thể xử lý tối đa 4 luồng AI đồng thời, mặc dù nó có thể được cấu hình lại nhanh chóng để xử lý số lượng luồng khác nhau. Động cơ được cắm trực tiếp vào hệ thống con bộ nhớ của chip, do đó, nó chia sẻ một nhóm bộ nhớ nhất quán với CPU và GPU tích hợp. Tôi đã bao gồm các slide của AMD từ buổi ra mắt trong album trên — chúng cung cấp một cái nhìn tổng quan về cách thức hoạt động của động cơ.
Đầu tiên, tôi mở trình quản lý tác vụ để xem liệu công cụ AI có liệt kê chính nó dưới dạng lõi hiển thị với các chỉ số sử dụng hay không, nhưng công cụ AI XDNA không hiển thị dưới dạng thiết bị hiển thị. Như bạn có thể thấy trong album trên, tôi đã tìm thấy công cụ AI được liệt kê là ‘Thiết bị AMD IPU’ trong trình quản lý thiết bị. Tuy nhiên, chúng tôi không thể quan sát tải hoặc phép đo từ xa khác từ các lõi trong quá trình thử nghiệm.
Ở đây, chúng ta có thể thấy công cụ XDNA AI đang xử lý khối lượng công việc nhận dạng khuôn mặt. Ở bên phải màn hình, chúng ta có thể thấy phép đo độ trễ cho từng bước của khối lượng công việc và trong khi các thanh thấp một cách ấn tượng và khối lượng công việc chạy nhanh qua một loạt hình ảnh khi công cụ AI xử lý khối lượng công việc suy luận, chúng tôi không có bất kỳ bối cảnh nào về cách so sánh những số liệu đó với các loại giải pháp khác.
Bản demo của AMD có một nút để kiểm tra công cụ AI tích hợp của họ với dịch vụ Azure ONNX EP trực tuyến, nhưng nhóm bản demo cho chúng tôi biết họ đã gặp sự cố với phần mềm nên phần mềm này không hoạt động. Đương nhiên, chúng tôi mong đợi công cụ Ryzen AI tích hợp có độ trễ thấp hơn dịch vụ Azure và đó là điều hợp lý mà AMD đang cố gắng chứng minh ở đây. Thật không may, chúng tôi không có điểm so sánh cơ bản cho kết quả điểm chuẩn.
Tuy nhiên, điểm chuẩn cho thấy AI vẫn tồn tại trên bộ xử lý Ryzen 7040 của AMD và công ty cũng đang tiến hành tốt việc củng cố số lượng ứng dụng có thể tận dụng công cụ AI của mình.
AMD đã công bố vào tuần trước tại hội nghị Build của Microsoft rằng họ đã tạo ra một bộ công cụ dành cho nhà phát triển mới tận dụng Nhà cung cấp thực thi AI (EP) Vitis mã nguồn mở, sau đó được ngược dòng trong thời gian chạy ONNX, để giảm bớt công việc cần thiết để thêm hỗ trợ phần mềm cho công cụ AI XDNA. McAfee giải thích rằng Vitis AI EP hoạt động như một loại lớp dịch kim loại trần cho phép các nhà phát triển chạy các mô hình mà không cần phải thay đổi mô hình cơ sở. Điều đó đơn giản hóa việc tích hợp.
AMD chưa cung cấp số liệu hiệu suất cho công cụ AI của mình, nhưng McAfee lưu ý rằng thật khó để định lượng lợi thế của công cụ AI tích hợp chỉ với một số liệu hiệu suất, như TOPS, vì các lợi thế khác về hiệu suất năng lượng cao hơn và độ trễ thấp hơn là tất cả một phần lợi thế nhiều mặt của việc có một công cụ AI. Tuy nhiên, AMD sẽ chia sẻ số liệu trong tương lai.
McAfee nhắc lại kế hoạch của công ty là tiếp tục thực hiện lộ trình XDNA AI của mình, cuối cùng sẽ bổ sung động cơ này cho các bộ xử lý Ryzen khác trong tương lai. Tuy nhiên, hệ sinh thái phần mềm dành cho AI trên PC vẫn còn ở giai đoạn đầu và AMD sẽ tiếp tục khám phá sự đánh đổi so với lợi thế trong thế giới thực.
Phần lớn lợi thế của việc có một công cụ AI tích hợp nằm ở hiệu suất năng lượng, điều bắt buộc trong các thiết bị hạn chế về năng lượng như máy tính xách tay, nhưng điều đó có thể không có ý nghĩa trong một máy tính để bàn không bị hạn chế có thể sử dụng GPU hoặc CPU chuyên dụng mạnh hơn cho khối lượng công việc suy luận , nhưng không có bất kỳ lo ngại nào về thời lượng pin. Tôi đã hỏi McAfee liệu những yếu tố đó có thể ảnh hưởng đến quyết định của AMD về việc có đưa XDNA lên máy tính để bàn hay không và anh ấy trả lời rằng điều đó sẽ quyết định liệu tính năng này có mang lại đủ giá trị hay không để dành khu vực chết có giá trị cho nó. động cơ. AMD vẫn đang đánh giá tác động, đặc biệt là khi Ryzen 7040 tiến vào thị trường.
Hiện tại, AMD không xác nhận bất kỳ kế hoạch nào trong tương lai của mình, nhưng McAfee nói rằng mặc dù AMD cam kết công cụ AI là một phần trong lộ trình tương lai của mình, nhưng nó có thể không đến với tất cả các sản phẩm. Về lưu ý đó, ông cho biết có thể hình dung được các tùy chọn khác cho các loại chip khác nhau, chẳng hạn như máy tính để bàn, thúc đẩy chiến lược chiplet của AMD. Các tùy chọn khác, chẳng hạn như thẻ bổ trợ, cũng là những giải pháp khả thi.
Một điều chắc chắn là — chúng ta sẽ tiếp tục thấy công cụ XDNA AI tích hợp có thể mở rộng xuất hiện trong nhiều sản phẩm của AMD trong tương lai. Hy vọng, lần tới chúng ta cũng sẽ thấy một bản demo tốt hơn.