ChatGPT đã quản lý để tạo ra một số điều thú vị và vui nhộn trong tay phải, như thế này Billy Bass Miệng To dự án. Tuy nhiên, có một mặt tối hơn nhiều của AI có thể được sử dụng để tạo ra một số vấn đề phức tạp nghiêm trọng cho tương lai của CNTT. Một số chuyên gia CNTT gần đây đã vạch ra tiềm năng nguy hiểm của ChatGPT và khả năng tạo phần mềm độc hại đa hình gần như không thể phát hiện được bằng tính năng phát hiện và phản hồi điểm cuối (EDR).
EDR là một loại kỹ thuật an ninh mạng có thể được triển khai để bắt phần mềm độc hại. Tuy nhiên, các chuyên gia cho rằng giao thức truyền thống này không phù hợp với tác hại tiềm ẩn mà ChatGPT có thể tạo ra. Mã có thể biến đổi – đây là lúc thuật ngữ đa hình xuất hiện – có thể khó phát hiện hơn nhiều.
Hầu hết các mô hình học ngôn ngữ (LLM) như ChatGPT đều được thiết kế với các bộ lọc sẵn có để tránh tạo ra nội dung không phù hợp mà người tạo cho là không phù hợp. Điều này có thể bao gồm từ các chủ đề cụ thể, trong trường hợp này là mã độc hại. Tuy nhiên, không mất nhiều thời gian để người dùng tìm cách vượt qua các bộ lọc này. Chính chiến thuật này khiến ChatGPT đặc biệt dễ bị tấn công bởi những cá nhân muốn tạo tập lệnh có hại.
Jeff Sims là kỹ sư bảo mật của HYAS InfoSec, một công ty tập trung vào bảo mật CNTT. Trở lại vào tháng 3, Sims đã xuất bản một tờ giấy trắng trình bày chi tiết về một dự án bằng chứng về khái niệm mà anh ấy gọi là Mamba đen. Ứng dụng này là một loại keylogger đa hình gửi yêu cầu tới ChatGPT bằng cách sử dụng API mỗi khi nó chạy.
Sims giải thích: “Sử dụng các kỹ thuật mới này, kẻ đe dọa có thể kết hợp một loạt các hành vi điển hình có khả năng phát hiện cao thành một tổ hợp bất thường và tránh bị phát hiện bằng cách khai thác việc mô hình không thể nhận ra đó là một mẫu độc hại.
Một công ty an ninh mạng khác, CyberArk, gần đây đã chứng minh khả năng của ChatGPT trong việc tạo loại phần mềm độc hại đa hình này trong một bài đăng trên blog của Eran Shimony và Omer Tsarfati. Trong bài đăng, họ giải thích cách chèn mã từ các yêu cầu ChatGPT giúp sửa đổi tập lệnh sau khi được kích hoạt, tránh các kỹ thuật hiện đại hơn được sử dụng để phát hiện hành vi nguy hiểm.
Hiện tại, chúng tôi chỉ có những ví dụ này làm bằng chứng về khái niệm — nhưng hy vọng nhận thức này sẽ dẫn đến nhiều phát triển hơn để ngăn chặn tác hại mà loại mã đột biến này có thể gây ra trong môi trường thực tế.