Inflection AI, một công ty khởi nghiệp mới được thành lập bởi cựu giám đốc có đầu óc sâu sắc và được hỗ trợ bởi Microsoft và Nvidia, tuần trước đã huy động được 1,3 tỷ đô la từ các đối thủ nặng ký trong ngành bằng tiền mặt và tín dụng đám mây. Có vẻ như công ty sẽ sử dụng tiền để xây dựng một cụm siêu máy tính được cung cấp bởi 22.000 GPU tính toán H100 của Nvidia, sẽ có hiệu suất năng lượng tính toán cao nhất theo lý thuyết tương đương với siêu máy tính Frontier.
Mustafa Suleyman, người sáng lập DeepMind và là người đồng sáng lập Inflection AI, cho biết: “Chúng tôi sẽ xây dựng một cụm gồm khoảng 22.000 chiếc H100. “Đây là khả năng tính toán cao hơn xấp xỉ ba lần so với những gì được sử dụng để đào tạo tất cả GPT-4. Tốc độ và quy mô là những gì sẽ thực sự cho phép chúng tôi xây dựng một sản phẩm khác biệt.”
Một cụm được hỗ trợ bởi 22.000 GPU điện toán Nvidia H100 về mặt lý thuyết có khả năng đạt được 1.474 exaflop hiệu suất FP64 — tức là sử dụng lõi Tensor. Với mã FP64 chung chạy trên lõi CUDA, thông lượng tối đa chỉ cao bằng một nửa: 0,737 FP64 exaflop. Trong khi đó, siêu máy tính nhanh nhất thế giới, Frontier, có hiệu năng tính toán cao nhất là 1.813 FP64 exaflop (gấp đôi con số đó là 3.626 exaflop đối với hoạt động ma trận). Điều đó đặt máy tính mới theo kế hoạch ở vị trí thứ hai vào lúc này, mặc dù nó có thể tụt xuống thứ tư sau khi El Capitan và Aurora hoàn toàn trực tuyến.
Mặc dù hiệu suất của FP64 rất quan trọng đối với nhiều khối lượng công việc khoa học, nhưng hệ thống này có thể sẽ nhanh hơn nhiều đối với các tác vụ hướng đến AI. Thông lượng cao nhất của FP16/BF16 là 43,5 exaflop và tăng gấp đôi lên 87,1 exaflop đối với thông lượng FP8. Siêu máy tính Frontier được cung cấp bởi 37.888 bộ nhớ trong MI250X của AMD có thông lượng BF16/FP16 cao nhất là 14,5 exaflop.
Chi phí của cụm chưa được biết, nhưng hãy nhớ rằng GPU điện toán H100 của Nvidia được bán lẻ với giá hơn 30.000 đô la mỗi đơn vị, chúng tôi hy vọng GPU cho cụm có giá hàng trăm triệu đô la. Thêm vào tất cả các máy chủ giá và phần cứng khác và điều đó sẽ chiếm phần lớn trong số 1,3 tỷ đô la tài trợ.
Inflection AI hiện được định giá khoảng 4 tỷ đô la, khoảng một năm sau khi thành lập. Sản phẩm hiện tại duy nhất của nó là một chatbot AI thế hệ có tên là Pi, viết tắt của trí thông minh cá nhân. Pi được thiết kế để hoạt động như một trợ lý cá nhân được hỗ trợ bởi AI với công nghệ AI tổng quát giống như ChatGPT sẽ hỗ trợ lập kế hoạch, lên lịch và thu thập thông tin. Điều này cho phép Pi giao tiếp với người dùng thông qua đối thoại, giúp mọi người có thể đặt câu hỏi và đưa ra phản hồi. Trong số những thứ khác, Inflection AI đã vạch ra các mục tiêu trải nghiệm người dùng cụ thể cho Pi, chẳng hạn như cung cấp hỗ trợ về mặt cảm xúc.
Hiện tại, Inflection AI vận hành một cụm dựa trên 3.584 GPU điện toán Nvidia H100 trong đám mây Microsoft Azure. Cụm siêu máy tính được đề xuất sẽ cung cấp hiệu suất gấp khoảng sáu lần so với giải pháp dựa trên đám mây hiện tại.