AWS sử dụng Habana Gaudi của Intel cho các mô hình ngôn ngữ lớn

Mặc dù Habana Gaudi của Intel cung cấp hiệu suất cạnh tranh phần nào và đi kèm với gói phần mềm Habana SynapseAI, nhưng nó vẫn kém hơn so với GPU điện toán hỗ trợ CUDA của Nvidia. Điều này, kết hợp với tính khả dụng hạn chế, là lý do tại sao Gaudi không phổ biến đối với các mô hình ngôn ngữ lớn (LLM) như ChatGPT.

Giờ đây, khi cơn sốt AI đang bắt đầu, Habana của Intel đang được triển khai rộng rãi hơn. Amazon Web Services đã quyết định dùng thử Gaudi thế hệ thứ nhất của Intel với PyTorch và DeepSpeed ​​để đào tạo LLM và kết quả đủ hứa hẹn để cung cấp các phiên bản DL1 EC2 trên thị trường.

Chia sẻ cho bạn bè cùng đọc