Biren, nhà phát triển GPU điện toán của Trung Quốc, đang cân nhắc phát hành cổ phiếu lần đầu ra công chúng (IPO) tại Hồng Kông trong năm nay. Theo một báo cáo từ Bloomberg, điều này xảy ra khi các khách hàng trong nước đang ngày càng ưa chuộng chip AI của họ hơn là của Nvidia, vốn đắt đỏ và khan hiếm. Với hy vọng nắm bắt cơ hội này, công ty khởi nghiệp công nghệ đang định vị chính mình để tận dụng nhu cầu ngày càng tăng đối với các sản phẩm của mình
Biren dự kiến sẽ đăng ký bán cổ phần lần đầu tiên trong vài tuần tới, theo báo cáo trích dẫn các nguồn ẩn danh. Đồng thời, Biren đang đàm phán với các nhà đầu tư tiềm năng, bao gồm cả các quỹ do chính phủ hỗ trợ ở Quảng Châu. Các cuộc thảo luận này tập trung vào một vòng tài trợ độc lập khác có thể thu về khoảng 2 tỷ nhân dân tệ (279 triệu USD). Biren đang tìm cách huy động vốn vào năm ngoái với mức định giá 17 tỷ nhân dân tệ, tương đương khoảng 2,4 tỷ USD. Hiện tại, Biren vẫn chưa xác định phạm vi IPO, cùng với khung thời gian chính xác.
Lý do khiến Biren tự tin về mức định giá của mình là vì các sản phẩm của công ty có vẻ cạnh tranh so với GPU điện toán của Nvidia (ít nhất là trên giấy tờ) và thị trường GPU điện toán có khả năng AI đang bùng nổ ngày nay.
Dòng GPU điện toán đầu tay của Biren bao gồm hai tùy chọn: BR100 và BR104. BR104 ‘cơ sở’ mang lại hiệu suất lên tới 128 FP32 TFLOPS hoặc 1 INT8 PetaFLOPS, trong khi BR100 cao cấp hơn — về cơ bản là hai BR104 trên một bộ xen kẽ silicon — mang lại hiệu suất lên tới 256 FP32 TFLOPS hoặc 2 INT8 PetaFLOPS. BR104 tầm trung đi kèm với bộ nhớ HBM2E 32 GB, sử dụng giao diện 2048 bit cung cấp băng thông 819 GB/giây. Ngược lại, BR100 cao cấp được trang bị bộ nhớ HBM2E 64GB, có giao diện 4096-bit với băng thông 1,64 TB/s.
Ô Tiêu đề – Cột 0 | Biren BR104 | Biren BR100 | NVIDIA A100 | Nvidia H100 |
---|---|---|---|---|
Yếu tố hình thức | Thẻ FHFL | Mô-đun OAM | SXM4 | SXM5 |
Số lượng bóng bán dẫn | ? | 77 tỷ | 54,2 tỷ | 80 tỷ |
Nút | N7 | N7 | N7 | 4N |
Quyền lực | 300W | 550W | 400W | 700W |
TFLOPS FP32 | 128 | 256 | 19,5 | 60 |
TF32+ TFLOPS | 256 | 512 | ? | ? |
TF32 TFLOPS | ? | ? | 156/312* | 500/1000* |
TFLOPS FP16 | ? | ? | 78 | 120 |
Tenor FP16 TFLOPS | ? | ? | 312/624* | 1000/2000* |
TFLOPS BF16 | 512 | 1024 | 39 | 120 |
Tenor BF16 TFLOPS | ? | ? | 312/624* | 1000/2000* |
INT8 | 1024 | 2048 | ? | ? |
Tenor INT8 TFLOPS | ? | ? | 624/1248* | 2000/4000* |
Có một lý do khác cho sự lạc quan của Biren. Những nỗ lực gây quỹ của nó trùng hợp với nỗ lực thúc đẩy mạnh mẽ của chính phủ Trung Quốc nhằm thúc đẩy ngành công nghiệp bán dẫn trong nước. Động thái này là một phản ứng đối với chiến dịch do Hoa Kỳ dẫn đầu đã ngăn chặn các công ty Trung Quốc mua nhiều GPU điện toán từ AMD, Intel và Nvidia, tất cả đều cạnh tranh với các sản phẩm của Biren. Do các sản phẩm của Nvidia đắt và khan hiếm, theo báo cáo của các phương tiện truyền thông, Biren có thể bán nhiều GPU hơn, ít nhất là cho các công ty không sử dụng ngăn xếp phần mềm CUDA của Nvidia cho khối lượng công việc AI của họ.
Nhưng Biren cũng đang phải đối mặt với nhiều thách thức. Năm ngoái, TSMC đã tạm dừng vận chuyển GPU điện toán cho Biren nhằm đảm bảo rằng chúng đáp ứng các quy tắc xuất khẩu của Hoa Kỳ về hiệu suất và khả năng. Điều này buộc công ty phải cắt giảm nhân sự để cắt giảm chi phí. Rõ ràng, Biren có thể mua đủ silicon vào lúc này, vì vậy công việc chính của họ vào lúc này là đảm bảo rằng kho phần mềm của họ có khả năng cạnh tranh khi so sánh với Nvidia, Intel và AMD.
Trong lĩnh vực này, Nvidia cực kỳ khó bị đánh bại. Công ty đã dành gần hai thập kỷ để tinh chỉnh CUDA và trong những năm gần đây đã đầu tư hàng trăm triệu USD vào việc tạo ra nền tảng CUDA được lựa chọn để phát triển AI. Hiện tại, nhiều công ty siêu quy mô của Trung Quốc thích sử dụng GPU của Nvidia cho các sản phẩm AI của họ do tính ưu việt của CUDA và số tiền họ đã đầu tư vào hệ sinh thái này.