Một vài tuần trước, chúng tôi đã báo cáo về Runway Gen-2, một công cụ chuyển văn bản thành video trực tuyến, tạo ra các clip dài 4 giây dựa trên lời nhắc của bạn. Cho đến thời điểm hiện tại, dịch vụ miễn phí chỉ có sẵn ở phiên bản beta kín hoạt động thông qua một loạt kênh riêng trên máy chủ Discord của Runway. Tuy nhiên, kể từ hôm nay, Gen-2 đã có sẵn cho tất cả mọi người và bạn có thể sử dụng nó qua trang web của công ty thay vì Discord.
Để sử dụng Runway Gen-2, bạn cần tạo một tài khoản miễn phí và tại trang web của Runway, sau đó điều hướng đến app.runwayml.com/ai-tools/gen-2 để tìm công cụ (hoặc nhấp vào liên kết trong bảng điều khiển của bạn ở đó ). Công ty đã có công cụ Gen-1, công cụ sửa đổi các video hiện có để làm cho chúng trông khác đi (ví dụ: biến mọi người thành Claymation), có sẵn cho mọi người trong nhiều tháng, nhưng Gen-2 sử dụng lời nhắc bằng văn bản đơn giản như “rô-bốt đang uống bia” và biến chúng thành clip.
Như chúng tôi đã lưu ý trong câu chuyện trước về Gen-2, các video clip hoàn toàn không có âm thanh và chúng thường có chuyển động rất hạn chế. Mặc dù bạn có thể tải xuống các clip ở định dạng MP4 nhưng chúng thường trông giống GIF động hơn. Để phục vụ mục đích xem, tôi đã chuyển đổi tất cả các clip được nhúng trong bài viết này thành GIF nhưng dường như điều đó không ảnh hưởng đến độ mượt của chúng.
Bạn cũng có thể tải ảnh lên và sau đó đưa ra lời nhắc cho Gen-2 để yêu cầu Gen-2 sử dụng hình ảnh đó làm nguồn cảm hứng. Tôi đã tải lên một bức ảnh chân dung của chính mình và yêu cầu nó hiển thị “anh chàng này đang uống bia”.
Người trong video trông khá giống tôi — anh ấy là một người da trắng trung niên, hói đầu với bộ râu muối tiêu và cặp kính xanh sáng — nhưng anh ấy không thực sự uống bia; nó không rõ ràng những gì anh ta phải nhét vào miệng.
Sau khi bạn đã nhập lời nhắc của mình (và có thể là ảnh), bạn nhấp vào nút Tạo và công cụ sẽ cho bạn biết liệu bạn có đang ở trong hàng đợi để yêu cầu của bạn được xử lý hay không. Sau đó, nó cung cấp cho bạn một tỷ lệ phần trăm cho bạn biết video của bạn đã hoàn thành bao nhiêu phần trăm. Trong các thử nghiệm của tôi, luôn mất chưa đến một phút kể từ khi tôi nhập lời nhắc cho đến khi hoàn thành video. Điều này phù hợp với những gì tôi đã trải nghiệm khi sử dụng phiên bản beta của Gen-2, ngoại trừ, trong trường hợp đó, tôi sẽ gửi lời nhắc của mình tới bot Discord. Bot này không hiển thị phần trăm tiến trình mà thay vào đó sẽ chỉ gửi lại video cho tôi sau một phút hoặc lâu hơn.
Khi video hoàn tất, bạn sẽ thấy nó trên màn hình và bạn có thể phát video ngay tại đó hoặc nhấp vào nút để tải xuống dưới dạng tệp MP4. Nó cũng sẽ được lưu trữ trong phần tài sản của tài khoản của bạn.
Không giống như phiên bản beta của Gen-2, có vẻ như có giới hạn về số lượng video bạn có thể tạo miễn phí. Tài khoản miễn phí của tôi hiển thị giới hạn video là 60 giây, với tốc độ 4 giây cho mỗi clip, tương đương với 15 clip.
Nếu bạn sử dụng hết tín dụng của mình hoặc bạn muốn có các tính năng bổ sung như video được nâng cấp (độ phân giải cao hơn) hoặc video không chứa hình mờ của Runway, bạn cần thanh toán cho tài khoản Tiêu chuẩn với mức phí 15 đô la một tháng hoặc 144 đô la một năm khi thanh toán cùng một lúc . Với mức giá đó, bạn nhận được 125 giây video mỗi tháng và có thể trả thêm tiền để có thêm.
Kể từ khi có quyền truy cập vào bản beta riêng tư cách đây vài tuần, tôi đã dành rất nhiều thời gian để chơi với Gen-2. Tôi rất ấn tượng với nhiều clip hay, nhưng nó rất không nhất quán và mọi người có thể trông giống như họ đến từ thung lũng kỳ lạ, với những biểu cảm kỳ lạ trong mắt hoặc các bộ phận cơ thể bị biến dạng.
Dù tốt hay xấu, công cụ này khá tệ trong việc tạo lại các ký tự cụ thể. Vào nhiều thời điểm, tôi đã yêu cầu nó tạo video về các nhân vật hoạt hình Peppa Pig, Paddington Bear và Blue từ Blue’s Clues và chúng trông giống những nhân vật đó và thường là phim hoạt hình, nhưng sự giống nhau không chính xác lắm. Một hình ảnh cụ thể về Peppa Pig chân thực thực sự rùng rợn và có vẻ như nó được cắt ra từ một bộ phim kinh dị.
Bạn cũng có thể quên việc yêu cầu thứ gì đó liên quan đến logo của công ty. Tôi đã nhiều lần yêu cầu nó tạo các video sử dụng tên hoặc logo của Tom’s Hardware và thay vào đó là các chữ cái vô nghĩa.
Tuy nhiên, một điều Runway Gen-2 thực sự giỏi là tạo ra hình ảnh của những người máy đang uống đồ uống có cồn hoặc làm những việc “quán bar” khác. Mỗi lần tôi hỏi nó về việc robot uống rượu, hút thuốc, khiêu vũ, rót bia hay rửa tay trong phòng vệ sinh nam ở quán bar, tôi đều nhận được kết quả khá tốt. Tôi thậm chí còn có những đoạn phim hay về rô-bốt diễn hài độc thoại hoặc hát trong phòng chờ. Yêu cầu rô-bốt chơi bi-a, bi-lắc hoặc phi tiêu trên một thanh là một hành động hỗn hợp.
Các lĩnh vực thành công khác mà tôi nhận thấy bao gồm các gia đình dùng bữa cùng nhau và chế độ xem tua nhanh thời gian về thành phố hoặc cảnh thiên nhiên.
Bất chấp những hạn chế của Runway Gen-2, chúng tôi đã thấy một số người rất sáng tạo biến chúng thành những bộ phim dài hơn bằng cách ghép nhiều clip lại với nhau. Có lẽ ví dụ nổi tiếng nhất về phim Runway Gen-2 là quảng cáo pizza Pepperoni Hugspot Commercial, được thực hiện bởi một người sáng tạo có tên là Pizza Later. Sau đó, Pizza đã làm việc với một người bạn để tạo quảng cáo cho một loại thuốc chống đầy hơi giả có tên là FlatuLess mà chúng tôi đã nhúng bên dưới.
Lưu ý rằng âm nhạc và thuyết minh đã được tạo bằng các công cụ AI khác và tất cả các clip đều do con người ghép lại với nhau bằng Adobe After Effects. Các clip trông giống như từ một quảng cáo cũ vì Pizza Sau đó đã sử dụng bộ lọc Red Giant VHS trên chúng.
Nếu bạn muốn dùng thử Runway Gen-2 và xem những gì bạn có thể tạo với nó, tất cả những gì bạn cần làm là truy cập runwayml.com và đăng ký một tài khoản miễn phí.