Nvidia một lần nữa đột phá trí tưởng tượng của mọi người trong việc sử dụng AI để chuyển các nội dung văn bản thành bức ảnh đẹp.
Mô hình AI mới nhất GauGAN2 của Nvidia không chỉ có thể tạo ra các bức ảnh phong cảnh thực tế dựa trên các từ trong văn bản mà còn sử dụng các bức ảnh chữ P trong thời gian thực.
Khi kích hoạt AI nếu người dùng nhập đoạn text "sóng vỗ bờ đá" và ngay lập tức cho ra một bức ảnh thực tế:
Nếu nhập đoạn text "Một hồ nước yên bình được bao quanh bởi những cây cao trong một ngày sương mù" sẽ cho ra hình ảnh sau:
Các hiệu ứng trên đều được thực hiện bởicông nghệ AI của Nvidia có tên "GauGAN2", "phiên bản đầy đủ" sẽ còn nhiều chức năng hơn thế nữa. Từ bản phác thảo đến văn bản, ảnh phong cảnh có thể được demo. GauGAN2 có ba chế độ minh họa bằng hình ảnh hoặc tranh.
- Chế độ đầu tiên là tạo ảnh bằng cách nhập text để tạo ra hình ảnh như các ví dụ ở trên.
- Chế độ thứ 2 , "Hình ảnh loại P", chỉnh sửa trực tiếp một phần của hình ảnh bằng văn bản. Chỉ cần khoanh tròn phần bạn muốn thay thế, nhập nội dung bạn muốn và ngay lập tức bạn có thể tạo ra nhiều cảnh quan mới lạ.
- Chế độ thứ ba là sử dụng graffiti tạo ra các bức ảnh phong cảnh.
Đây là kỹ năng quản lý chính của GauGAN2 thế hệ trước (GauGAN được Nvidia ra mắt vào năm 2019). Nếu bạn muốn có "một bầu trời và hai mặt trời" sau đây, bạn có thể thêm một cái khác theo cách thủ công vào hình ảnh được tạo bằng văn bản.
GauGAN2 sẽ tạo lại hình ảnh dựa trên hình ảnh hiện có và bạn sẽ có được phong cảnh kỳ diệu mà tôi gọi là "Đảo đầu người":
Trở lại GauGAN2, NVIDIA viết, "Chỉ cần nhấn một nút, người dùng có thể tạo ra một bản đồ phân đoạn, một đường viền cấp cao hiển thị vị trí của các đối tượng trong cảnh. Từ đó, họ có thể chuyển sang vẽ, chỉnh sửa cảnh bằng các bản phác thảo thô bằng cách sử dụng các nhãn như bầu trời, cây cối, đá và sông, cho phép cọ vẽ thông minh kết hợp những nét vẽ nguệch ngoạc này thành những hình ảnh tuyệt đẹp.".
Theo Nvidia, GauGAN2 khác với các mô hình như "hình ảnh văn bản" và "hình ảnh phân đoạn". GauGAN2 có thể tạo ra nhiều loại ảnh hơn và chất lượng cao hơn. Tuy nhiên, thỉnh thoảng vẫn có một số lỗi.
Một số người dùng cảm thấy rằng tính năng tự động tạo phong cảnh này có thể được Adobe sử dụng trong tương lai. Một điểm nữa là GauGAN2 có thể được sử dụng trên trình duyệt, mọi người có thể để lại tin nhắn thảo luận về trải nghiệm của riêng bạn.
Ngay bây giờ bạn đọc có thể trải nghiệm GauGAN2 tại đây
Tổng hợp theo VN-Z
Mô hình AI mới nhất GauGAN2 của Nvidia không chỉ có thể tạo ra các bức ảnh phong cảnh thực tế dựa trên các từ trong văn bản mà còn sử dụng các bức ảnh chữ P trong thời gian thực.
Khi kích hoạt AI nếu người dùng nhập đoạn text "sóng vỗ bờ đá" và ngay lập tức cho ra một bức ảnh thực tế:
Nếu nhập đoạn text "Một hồ nước yên bình được bao quanh bởi những cây cao trong một ngày sương mù" sẽ cho ra hình ảnh sau:
Các hiệu ứng trên đều được thực hiện bởicông nghệ AI của Nvidia có tên "GauGAN2", "phiên bản đầy đủ" sẽ còn nhiều chức năng hơn thế nữa. Từ bản phác thảo đến văn bản, ảnh phong cảnh có thể được demo. GauGAN2 có ba chế độ minh họa bằng hình ảnh hoặc tranh.
- Chế độ đầu tiên là tạo ảnh bằng cách nhập text để tạo ra hình ảnh như các ví dụ ở trên.
- Chế độ thứ 2 , "Hình ảnh loại P", chỉnh sửa trực tiếp một phần của hình ảnh bằng văn bản. Chỉ cần khoanh tròn phần bạn muốn thay thế, nhập nội dung bạn muốn và ngay lập tức bạn có thể tạo ra nhiều cảnh quan mới lạ.
- Chế độ thứ ba là sử dụng graffiti tạo ra các bức ảnh phong cảnh.
Đây là kỹ năng quản lý chính của GauGAN2 thế hệ trước (GauGAN được Nvidia ra mắt vào năm 2019). Nếu bạn muốn có "một bầu trời và hai mặt trời" sau đây, bạn có thể thêm một cái khác theo cách thủ công vào hình ảnh được tạo bằng văn bản.
Hiệu ứng chồng chéo được sử dụng trong một số trò chơi này khiến cư dân mạng không khỏi lo lắng. Ví dụ: ZDNet đã giả mạo một trò chơi ma thuật, vẽ một khuôn mặt trên background phong cảnh
GauGAN2 sẽ tạo lại hình ảnh dựa trên hình ảnh hiện có và bạn sẽ có được phong cảnh kỳ diệu mà tôi gọi là "Đảo đầu người":
Trở lại GauGAN2, NVIDIA viết, "Chỉ cần nhấn một nút, người dùng có thể tạo ra một bản đồ phân đoạn, một đường viền cấp cao hiển thị vị trí của các đối tượng trong cảnh. Từ đó, họ có thể chuyển sang vẽ, chỉnh sửa cảnh bằng các bản phác thảo thô bằng cách sử dụng các nhãn như bầu trời, cây cối, đá và sông, cho phép cọ vẽ thông minh kết hợp những nét vẽ nguệch ngoạc này thành những hình ảnh tuyệt đẹp.".
Theo Nvidia, GauGAN2 khác với các mô hình như "hình ảnh văn bản" và "hình ảnh phân đoạn". GauGAN2 có thể tạo ra nhiều loại ảnh hơn và chất lượng cao hơn. Tuy nhiên, thỉnh thoảng vẫn có một số lỗi.
Một số người dùng cảm thấy rằng tính năng tự động tạo phong cảnh này có thể được Adobe sử dụng trong tương lai. Một điểm nữa là GauGAN2 có thể được sử dụng trên trình duyệt, mọi người có thể để lại tin nhắn thảo luận về trải nghiệm của riêng bạn.
Ngay bây giờ bạn đọc có thể trải nghiệm GauGAN2 tại đây
Tổng hợp theo VN-Z
Chủ đề liên quan