Google đã khởi động Google I/O vào chiều nay bằng cuộc nói chuyện trong hơn một giờ về nhiều tiến bộ của họ trong lĩnh vực trí tuệ nhân tạo. Công ty đã thảo luận về mô hình ngôn ngữ lớn (LLM) PaLM 2 mới của mình cho AI tổng quát, hỗ trợ công cụ chatbot Bard. Đây là trụ cột cơ bản để bổ sung các tính năng được tích hợp trí tuệ nhân tạo vào danh mục sản phẩm của Google, bao gồm Google Maps, Google Photos và Gmail (trong số những sản phẩm khác).
Với ý nghĩ đó, cần có một số mã lực nghiêm trọng trong đám mây để cung cấp năng lượng cho các mô hình trong tự nhiên, vì hàng triệu (và cuối cùng là hàng tỷ) người dùng gửi yêu cầu cho các hoạt động đơn giản như loại bỏ một người nán lại trong nền của một bức tranh để soạn toàn bộ email cho bạn dựa trên lời nhắc văn bản ngắn. Đó là nơi mà siêu máy tính GPU A3 mới của Google được chú trọng. Google cho biết các siêu máy tính A3 mới “được xây dựng nhằm mục đích đào tạo và phục vụ các mô hình AI đòi hỏi khắt khe nhất, cung cấp năng lượng cho sự đổi mới mô hình ngôn ngữ lớn và AI tổng quát ngày nay” đồng thời mang lại hiệu suất AI 26 exaFlops.
Mỗi siêu máy tính A3 được trang bị bộ xử lý Intel Xeon Scalable thế hệ thứ 4 được hỗ trợ bởi bộ nhớ DDR5-4800 2TB. Nhưng “bộ não” thực sự của hoạt động đến từ tám GPU “Hopper” Nvidia H100, có khả năng truy cập băng thông chia đôi 3,6 TBps bằng cách tận dụng NVLink 4.0 và NVSwitch.
Theo Google, A3 đại diện cho việc triển khai cấp độ sản xuất đầu tiên của giao diện dữ liệu GPU-GPU, cho phép chia sẻ dữ liệu ở tốc độ 200 Gbps trong khi bỏ qua CPU chủ. Giao diện này, mà Google gọi là Đơn vị xử lý cơ sở hạ tầng (IPU), dẫn đến băng thông mạng khả dụng cho máy ảo (VM) A3 tăng gấp 10 lần so với máy ảo A2.
“Máy ảo A3 của Google Cloud, được hỗ trợ bởi GPU NVIDIA H100 thế hệ tiếp theo, sẽ đẩy nhanh quá trình đào tạo và phục vụ các ứng dụng AI tổng quát”, Ian Buck, Phó chủ tịch phụ trách điện toán hiệu năng cao và siêu quy mô tại NVIDIA cho biết. “Sau phiên bản G2 mới ra mắt gần đây của Google Cloud, chúng tôi tự hào tiếp tục hợp tác với Google Cloud để giúp chuyển đổi các doanh nghiệp trên toàn thế giới bằng cơ sở hạ tầng AI được xây dựng có mục đích.”
Nếu doanh nghiệp của bạn muốn tận dụng máy ảo A3, cách duy nhất để có quyền truy cập là điền vào Biểu mẫu quan tâm xem trước A3 của Google để tham gia Chương trình truy cập sớm. Nhưng như Google đã tuyên bố rõ ràng, việc bổ sung thông tin của bạn không đảm bảo một vị trí trong chương trình.