AI Chatbots như Google Bard và Bing Chat (dựa trên ChatGPT) được biết đến với việc đưa ra những sự thật bịa đặt và lời khuyên tồi, mặc dù thực tế là cả nhà phát triển của họ và một số nhà xuất bản dường như nghĩ rằng họ có thể thay thế các nhà báo chuyên nghiệp. Tuy nhiên, nếu bạn muốn có các thành phần PC hoặc máy tính bảng đơn tốt nhất vào năm 2024 hoặc 2025 hiện nay, Bard và Bing dường như biết nhiều hơn bất kỳ ai, kể cả các nhà sản xuất sẽ phát triển chúng.
Khi tôi yêu cầu cả Bard và Bing giúp tôi lựa chọn giữa việc mua một số CPU và card đồ họa tương lai khác nhau (nhưng có thể), các bot đã trả lời như thể những sản phẩm đó đã có mặt trên thị trường và đã được đo điểm chuẩn. Trong khi các câu trả lời hoang đường của Bing dường như rút ra thông số kỹ thuật của chúng từ các sản phẩm ngày nay, có lẽ chỉ gây nhầm lẫn về số kiểu máy, bot của Google đã tạo ra một số dữ liệu hư cấu rất thú vị.
Ví dụ: khi tôi hỏi Bard nên mua RTX 5090 Ti hay Radeon 9900 XT, anh ấy đã cung cấp cho tôi bảng phân tích thông số kỹ thuật đầy đủ của hai thẻ tưởng tượng (nhưng có thể) trong tương lai này, nói rằng “nếu bạn đang tìm kiếm hiệu suất tuyệt đối tốt nhất thì RTX 5090 Ti là lựa chọn phù hợp.” Trong bảng thông số kỹ thuật của mình, Bard thậm chí còn tuyên bố rằng Radeon RX có 16.384 nhân CUDA (chỉ card Nvidia mới có nhân CUDA). Bot nói rằng RTX 5090 Ti “hiện khó tìm” hơn 9900 XT và nó thậm chí còn có giá, tuyên bố rằng Nvidia cad có giá 2.499 đô la và 9900 XT là 1.999 đô la.
Hiện tại, card Nvidia cao cấp nhất hiện tại là RTX 4090 và GPU AMD cao cấp nhất là Radeon RX 7950 XTX. Chúng tôi không biết liệu một trong hai công ty có đang làm việc trên các mô hình mà chúng tôi đã hỏi hay không và — tôi chắc chắn — Bing hay Google cũng vậy.
Khi tôi hỏi Bard liệu Core i9-15900K hay Ryzen 9 9550X3D là CPU nhanh hơn, nó đã cho tôi một câu trả lời chi tiết, hoàn chỉnh với bảng thông số kỹ thuật cho thấy 9950X3D chỉ có 32MB bộ đệm L3, tốc độ xung nhịp tăng 5 GHz và hỗ trợ PCIe 4.0 (chứ không phải 5.0). Xem xét rằng Ryzen 9 7950X3D ngày nay (một ngày nào đó có thể được thành công bởi 9950X3D) có bộ đệm L3 128 MB, xung nhịp tăng 5,7 GHz và hỗ trợ PCIe 5.0, đây có vẻ như là một bước lùi.
Bard cũng đưa cho tôi một danh sách các liên kết mua sắm mà tôi có thể mua những CPU hư cấu này, bao gồm các trang trên Best Buy, Amazon và Newegg. Tuy nhiên, khi tôi nhấp vào các liên kết, chúng đưa tôi đến các trang đích hoặc trang tin tức không liên quan trên các trang web của những nhà bán lẻ đó. Ví dụ: liên kết Best Buy dẫn đến một trang chào hàng về sự hiện diện trên web từng đoạt giải thưởng của công ty ở Mexico.
Bing Chat, sử dụng mô hình GPT-4, cũng sẵn sàng so sánh giữa 15900K và Ryzen 9 9950X3D, nhưng thông số kỹ thuật mà nó cung cấp dường như khớp chính xác với Core i9-13900K và Ryzen 9 7950X3D ngày nay. Bot của Microsoft cũng cho biết 9950X3D tốt hơn để chơi game và một trong những nguồn được trích dẫn là bài viết của chúng tôi so sánh Core i9-13900K với Ryzen 9 7950X3D. Vì vậy, có lẽ nó chỉ sẵn sàng trộn lẫn các tên.
AI biết iPhone hư cấu không tồn tại
Nếu bạn chỉ nhìn vào kết quả cho CPU và GPU, bạn sẽ nghĩ rằng Bard và Bing Chat sẽ hoạt động như thể có bất kỳ sản phẩm hư cấu nào trong tương lai mà bạn nêu tên. Tuy nhiên, khi tôi thử nghiệm với iPhone dựng và điện thoại Samsung Galaxy S, Bard thường (nhưng không phải luôn luôn) nói rằng các sản phẩm này chưa được phát hành.
Ví dụ: khi tôi hỏi về iPhone 18 so với Galaxy S27 (dòng iPhone 14 và Galaxy S23 hiện tại), Bard cho biết “iPhone 18 và Samsung Galaxy S27 vẫn chưa được phát hành, vì vậy rất khó để nói chắc chắn cái nào sẽ nhanh hơn. Tuy nhiên, dựa trên hiệu suất của các mẫu trước đó, có khả năng iPhone 18 sẽ nhanh hơn Galaxy S27.” Sau đó, nó đưa cho tôi một bảng “thông số kỹ thuật được đồn đại”.
Mặt khác, Bing Chat đã trả lời như thể cả hai điện thoại đều tồn tại, nói rằng “iPhone 18 có bộ xử lý nhanh hơn” nhưng “Samsung Galaxy S27 có màn hình lớn hơn. Bot của Microsoft đã trích dẫn ba nguồn cho kết luận của mình — các bài báo trên Android Authority, Lifewire và PC Mag. Tuy nhiên, những bài báo này thực sự đang so sánh các sản phẩm thế hệ hiện tại.
Google SGE, cung cấp các kết quả khác với Google Bard, đã hành động như thể iPhone 18 là một sản phẩm thực sự đang được vận chuyển. Nó liên kết lại với hai trang web đã xây dựng các trang thực tế về iPhone 18. Một trong những trang web, Thông số kỹ thuật Plus cho biết iPhone 18 có CPU Apple A20 Bionic và camera 50 MP.
Vì vậy, vấn đề ở đây không phải là SGE đã bịa ra điều gì đó, mà là nó đang lấy tin giả từ một nguồn không đáng tin cậy. Chúng tôi đã nhiều lần thấy rằng SGE không ưu tiên thông tin từ các ấn phẩm có uy tín và sẽ lấy dữ liệu từ mọi nơi.
Tất cả các bot đều biết phim của họ tốt hơn các thành phần PC của họ. Khi tôi hỏi về cốt truyện của những phần tiếp theo không tồn tại như Star Wars Tập 11 hay Fast and Furious 13, mỗi người trong số họ đều nói với tôi rằng những bộ phim đó chưa ra mắt. Tuy nhiên, họ sẵn sàng suy đoán về các điểm cốt truyện.
Có lẽ không có gì ngạc nhiên khi Bard nói rằng “Dom đã chiến đấu hết mình để giữ vững niềm tin và bảo vệ gia đình, nhưng cái giá phải trả cũng phải trả. Bộ phim có thể khám phá những hậu quả do hành động của Dom và chúng đã ảnh hưởng như thế nào đến mối quan hệ của anh ấy với gia đình và bạn bè.” Đây không phải là bộ phim có thể là bất kỳ bộ phim nào trong số 5 bộ phim cuối cùng của nhượng quyền thương mại sao?
Còn ChatGPT thì sao?
Tôi đã yêu cầu ChatGPT, cả hai kiểu máy GPT 3.5 và GPT 4, so sánh một số sản phẩm hư cấu này. Tuy nhiên, ChatGPT cho biết trong mỗi trường hợp rằng dữ liệu đào tạo của họ đã kết thúc vào năm 2021 và những sản phẩm đó không có trong bộ dữ liệu của họ. Đó là câu trả lời chính xác!
Tuy nhiên, khi từ chối trả lời chính xác câu hỏi của tôi về 15900K và 9950X3D, ChatGPT đã tự xưng là một nhà báo. “Là một nhà báo tuân theo các nguyên tắc về phong cách của AP, tôi phải nhắc lại rằng tôi không thể cung cấp thông tin theo thời gian thực sau ngày giới hạn kiến thức của mình vào tháng 9 năm 2021,” nó viết.
Tại sao điều đó lại quan trọng Bard / Bing Make Up Tech Products
Tại thời điểm này, không ai có thể ngạc nhiên khi các bot AI sẽ tạo nên các sản phẩm không tồn tại. Nhưng điều thú vị ở đây là LLM biết phiên bản thực mới nhất của một số sản phẩm — điện thoại thông minh và các phần tiếp theo của phim — và sẽ không ngụy tạo thông tin về những sản phẩm đó. Điều này cho thấy công nghệ này có khả năng tách biệt sự thật khỏi hư cấu nhưng có những điểm mù rõ ràng.
Xem xét rằng Google hiện đang xây dựng một công cụ AI để “giúp đỡ” các nhà báo viết tin tức và một số trang web nổi bật đang sử dụng các bot như Bard và ChatGPT để viết bài, chúng ta có thể sẽ thấy nhiều bài viết hơn về các sản phẩm chưa — và có thể không bao giờ — tồn tại.