AI mới của Google có thể tạo ra bất kỳ bức hình "kì dị" nào mà bạn muốn chỉ từ những dòng văn bản mô tả ngắn gọn

Ngày cập nhật: 13/06/2022

Có bao giờ bạn nghĩ tới những hình ảnh kì lạ như một chú DJ Koala trông sẽ như thế nào chưa? Giờ đây bằng Imagen - hệ thống AI mới của Google, người ta đã có thể tạo ra những tấm hình kì dị mà chân thực đến khó tin chỉ bằng văn bản đầu vào.

Google tự tin khẳng định rằng AI mới của mình có thể đánh bại bất kỳ đối thủ nào. Với tên gọi Imagen, chương trình này dựa vào văn bản đầu vào - chẳng hạn như : 'một tấm hình chú gấu trúc đội mũ cao bồi đang cưỡi ngựa' - để cho ra một kết quả hình ảnh. Imagen có thể tạo ra những hình ảnh chân thực hoặc những hình ảnh được render theo phong cách nghệ thuật nhất có thể.

Imagen là đàn em của các AI chuyển đổi văn bản thành hình ảnh khác như DALL-E, VQ-GAN+CLIP và Latent Diffusion Models. Khi bị so sánh với các AI đi trước, Google nói rằng người dùng xác nhận Imagen vượt trội hơn các đối thủ cạnh tranh về độ chính xác và độ trung thực của hình ảnh.

Thành phẩm của Imagen cũng có thể có nhiều phong cách khác nhau, từ tranh sơn dầu đến kết xuất đồ họa CGI và thậm chí cả ảnh chụp, và giới hạn duy nhất của AI này là trí tưởng tượng của bạn. Chỉ có thể xem tận mắt thì bạn mới thấy được hết khả năng tuyệt vời của AI này.

Google đã chia sẻ một vài ví dụ về các dòng văn bản cũng như kết quả được tạo ra từ chúng trên trang web của Imagen chẳng hạn như 'gấu bông Teddy tham gia Olympic bộ môn bơi bướm 400m' - nhưng những hình ảnh này có lẽ chỉ là những kết quả tốt nhất được tạo ra. Còn những kết quả chưa tốt thì Google vẫn từ chối bình luận về chúng.

Trong mỗi bức hình thì văn bản ở bên dưới là dòng lệnh được đưa vào chương trình và hình ảnh chính là kết quả đầu ra. Mình muốn nhấn mạnh rằng: đó là tất cả những gì mà Imagen cần. Bạn nhập bất kì điều gì bạn muốn và chương trình sẽ tạo ra bức ảnh tương ứng. Khá tuyệt vời, phải không nào?

Mô hình học hỏi để chuyển đổi văn bản thành hình ảnh cho thấy khả năng bá đạo của các hệ thống học máy. Trong trường hợp này, Imagen loại bỏ nhu cầu sử dụng các phần mềm chuyên dụng như Photoshop để tạo ra các hình ảnh trừu tượng.

Hệ thống AI đang giúp Google đến gần hơn với tầm nhìn về một tương lai sử dụng 'ambient computing' (dịch thô là 'điện toán môi trường xung quanh'). Điện toán môi trường xung quanh là ý tưởng về một ngày trong tương lai mà con người sẽ có thể sử dụng máy tính một cách trực quan mà không cần kiến thức về các hệ thống cụ thể hoặc khả năng lập trình.

Tuy nhiên, Google vẫn chưa cho ra mắt chính thức Imagen. AI chuyển văn bản thành hình ảnh này lùng sục mọi ngóc ngách trên Internet để học hỏi thông tin và tạo ra hình ảnh. Và bởi vì thông tin trên Internet có thể chứa đầy những định kiến hoặc thành kiến, những định kiến này cuối cùng sẽ lọt vào Imagen.

Google cho biết những thành kiến này bao gồm sự thiên vị về tông màu da sáng hơn và một số định kiến về giới tính của văn hóa phương Tây. Công ty cũng lo ngại rằng Imagen có thể bị những kẻ xấu lợi dụng.

[caption id='attachment_602645' align='aligncenter' width='1180']

Ảnh 'Một bức tượng đá có gấu Koala đang làm DJ trước một chiếc bàn xoay đĩa'[/caption]

Google cảnh báo các nhà sản xuất AI khác nên cảnh giác với việc phát hành các mô hình chuyển văn bản thành hình ảnh ra công chúng mà không có sự chú ý chặt chẽ đến nguồn thông tin đầu vào để đào tạo AI.

'Các sản phẩm được tạo ra có thể bị dùng cho nhiều mục đích xấu, bao gồm quấy rối và lan truyền thông tin sai lệch, đồng thời gây ra nhiều lo ngại liên quan đến sự bài trừ và thành kiến về xã hội và văn hóa', theo một sách trắng do Google xuất bản.

[caption id='attachment_600384' align='aligncenter' width='1024']

Ảnh 'Chú chó nhìn vào gương và thấy ảnh phản chiếu của một chú mèo' do Imagen tạo ra[/caption] Kết luận cuối cùng của Google là Imagen “không phù hợp để sử dụng công cộng tại thời điểm này” và công ty cho biết họ có kế hoạch phát triển một quy trình mới để đánh giá “sự thiên vị xã hội và văn hóa trong tương lai”. Tuy nhiên, hiện tại, Imagen thật xứng đáng để chúng ta trầm trồ. Và đó chỉ là phần nổi của tảng băng chìm. Bạn nhận định thế nào về công nghệ mới nổi này, hãy theo dỏi Sforum để cập nhật thêm thông tin về nó nhé.

Thẻ: Công cụ AI Google google ai văn bản thành hình ảnh