Sau tin đồn chính phủ Mỹ có thể cấm bán GPU máy tính cao cấp cho Trung Quốc, giá chip A800 của Nvidia tại thị trường Trung Quốc đã tăng mạnh. Giá đã tăng vọt 20% chỉ sau hai tuần, theo một báo cáo từ DigiTimes.
Giá tiêu chuẩn của GPU tính toán A800 của Nvidia trong hệ số dạng PCIecard là khoảng 90.000 CNY (12.400 USD) mỗi đơn vị chỉ hai tuần trước. Ngay bây giờ, giá đang đạt gần 110.000 CNY (15.000 USD) mỗi chiếc, tăng 20%.
Vấn đề giá chip tăng cao, cùng với sự thiếu hụt cấp bách về sức mạnh tính toán ở Trung Quốc, đã thu hút sự chú ý tại Hội nghị Trí tuệ Nhân tạo Thế giới 2023. Việc mua chip AI cao cấp thông qua các con đường chính thức ở Trung Quốc ngày càng trở nên khó khăn. Và kết quả là, các công ty công nghệ Trung Quốc cần sức mạnh tính toán đã sử dụng các dịch vụ điện toán đám mây do các công ty như Amazon AWS và Microsoft Azure cung cấp. Các dịch vụ này thường được sử dụng cho các nhiệm vụ đào tạo mô hình ngôn ngữ lớn, với các trung tâm dữ liệu đặt tại Singapore hoặc Trung Quốc.
Chen Pei, phó chủ tịch của Vibranium Consulting, tuyên bố rằng việc cho thuê sức mạnh tính toán GPU trên đám mây đắt hơn đáng kể so với việc xây dựng các cụm điện toán GPU của riêng họ, với giá cho các nhà cung cấp đám mây lớn dao động trong khoảng 2 đến 3 USD mỗi giờ cho mỗi GPU. Nhắc lại điều này, Sun Jin từ CloudWalk Technology, một công ty thị giác máy tính và AI của Trung Quốc, tiết lộ rằng các công ty Trung Quốc thường không còn lựa chọn nào khác ngoài việc phải chịu chi phí cao khi cho thuê sức mạnh điện toán đám mây. Điều này xảy ra mặc dù các chi phí này cao hơn 50-100% so với việc thành lập trung tâm dữ liệu của riêng họ.
Tuy nhiên, khả năng các nhà cung cấp Trung Quốc tiếp tục sử dụng các dịch vụ điện toán đám mây có trụ sở tại Hoa Kỳ như AWS và Azure trong tương lai là không chắc chắn, vì điều này sẽ phụ thuộc vào các bước pháp lý do chính phủ Hoa Kỳ thực hiện, có thể liên quan đến sự cần thiết phải có giấy phép hoặc thậm chí một lệnh cấm hoàn toàn.
Ngành công nghiệp điện toán của Trung Quốc phải đối mặt với nhiều thách thức đáng kể, bao gồm quá trình xây dựng cụm máy tính AI tốn nhiều thời gian, khó khăn trong việc mua chip AI cao cấp từ nước ngoài và tình trạng thiếu chip AI sản xuất trong nước, chẳng hạn như BR104 và BR100 của Biren. Trước những hạn chế tiềm ẩn trong việc tiếp cận sức mạnh điện toán đám mây của châu Âu và Hoa Kỳ, các nhà sản xuất chất bán dẫn Trung Quốc ngày càng kỳ vọng chỉ tập trung vào việc tinh chỉnh quy trình sản xuất chip của họ và đạt được những bước tiến lớn trong đổi mới phần mềm.
Hàng 0 – Ô 0 | Biren BR104 | Nvidia A800 | NVIDIA A100 | Nvidia H100 |
Yếu tố hình thức | Thẻ FHFL | Thẻ FHFL (?) | SXM4 | SXM5 |
Số lượng bóng bán dẫn | ? | 54,2 tỷ | 54,2 tỷ | 80 tỷ |
Nút | N7 | N7 | N7 | 4N |
Quyền lực | 300W | ? | 400W | 700W |
TFLOPS FP32 | 128 | 13.7 (?) | 19,5 | 60 |
TF32+ TFLOPS | 256 | ? | ? | ? |
TF32 TFLOPS | ? | 109/218* (?) | 156/312* | 500/1000* |
TFLOPS FP16 | ? | 56 (?) | 78 | 120 |
Tenor FP16 TFLOPS | ? | 218/437* | 312/624* | 1000/2000* |
TFLOPS BF16 | 512 | 27 | 39 | 120 |
Tenor BF16 TFLOPS | ? | 218/437* | 312/624* | 1000/2000* |
INT8 | 1024 | ? | ? | ? |
Tenor INT8 TFLOPS | ? | 437/874* | 624/1248* | 2000/4000* |