GauGAN: Vẽ tranh dựa trên nội dung văn bảng bằng AI của NVIDIA
Chỉ với một đoạn văn bản mô tả về bức tranh, trí tuệ nhân tạo sẽ tự vẽ ra một bức tranh như thật bằng công nghệ GauGAN. Mô hình học sâu đằng sau GauGAN cho phép mọi người biến trí tưởng tượng của mình thành những kiệt tác chân thực dễ dàng hơn bao giờ hết. Chỉ cần nhập một cụm từ như “hoàng hôn trên bãi biển” và AI sẽ tạo ra một tác phẩm trong thời gian thực. Thêm một từ bổ sung như “hoàng hôn ở một bãi biển đầy đá” hoặc đổi “hoàng hôn” thành “buổi chiều” hoặc “ngày mưa” và tác phẩm sẽ ngay lập tức sửa đổi hình ảnh.
Chỉ với một nút bấm, người dùng có thể tạo ra một bản đồ thể hiện vị trí của các đối tượng trong ảnh. Từ đó, họ có thể chuyển sang vẽ, chỉnh sửa cảnh bằng cách sử dụng các nhãn như bầu trời, cây cối, đá và sông, kết hợp những nét vẽ nguệch ngoạc thành những tác phẩm tuyệt đẹp.
Tính năng chuyển văn bản thành hình ảnh mới của GauGAN2 hiện có thể được trải nghiệm trên NVIDIA AI Demos, nơi bạn có thể trải nghiệm AI thông qua các bản demo mới nhất từ NVIDIA Research. GauGAN2 cho phép người dùng tạo và tùy chỉnh các cảnh nhanh hơn và khả năng kiểm soát tốt hơn.
GauGAN: Vẽ tranh dựa trên nội dung văn bảng
GauGAN2 kết hợp lập bản đồ phân đoạn, sơn màu và tạo văn bản thành hình ảnh trong một mô hình duy nhất, làm cho nó trở thành một công cụ mạnh mẽ để tạo ra các nghệ thuật chân thực với sự kết hợp của văn bản và hình vẽ.
Bản demo này là một trong những phiên bản đầu tiên kết hợp nhiều phương thức – văn bản, phân đoạn, phác thảo và phong cách – trong một khuôn khổ GAN duy nhất. Điều này giúp việc chuyển tầm nhìn của nghệ sĩ thành hình ảnh chất lượng cao do AI tạo ra nhanh hơn và dễ dàng hơn.
Thay vì cần vẽ ra mọi yếu tố của một cảnh, người dùng có thể nhập một cụm từ ngắn gọn để nhanh chóng tạo ra các đối tượng và chủ đề chính của ảnh, chẳng hạn như một dãy núi phủ tuyết trắng. Sau đó có thể tùy chỉnh bằng các bản phác thảo để làm cho một ngọn núi cụ thể cao hơn hoặc thêm một vài cây ở tiền cảnh hoặc những đám mây trên bầu trời.
Nó không chỉ tạo ra những hình ảnh chân thực – các nghệ sĩ này còn có thể mô tả phong cảnh của thế giới khác.
Ví dụ, hãy tưởng tượng, tái tạo cảnh quan từ hành tinh Tatooine mang tính biểu tượng trong loạt phim Star Wars, nơi có hai mặt trời. Tất cả những gì cần viết là dòng chữ “mặt trời trên đồi sa mạc” để tạo điểm bắt đầu, sau đó người dùng có thể nhanh chóng phác thảo mặt trời thứ hai.
Đó là một quá trình lặp đi lặp lại, trong đó mỗi từ người dùng nhập vào hộp văn bản sẽ thêm nhiều đối tượng vào hình ảnh do AI tạo.
Mô hình AI đằng sau GauGAN2 đã được đào tạo trên 10 triệu bức ảnh phong cảnh chất lượng cao bằng cách sử dụng siêu máy tính NVIDIA Selene, một hệ thống NVIDIA DGX SuperPOD nằm trong số 10 siêu máy tính mạnh nhất thế giới. Các nhà nghiên cứu đã sử dụng một mạng lưới thần kinh để tìm hiểu mối liên hệ giữa các từ và hình ảnh tương ứng như “mùa đông”, “sương mù” hoặc “cầu vồng”.
So với các mô hình hiện đại dành riêng cho các ứng dụng chuyển văn bản sang hình ảnh, mạng nơ-ron đằng sau GauGAN2 tạo ra nhiều hình ảnh đa dạng hơn và chất lượng cao hơn.
NVIDIA Research có hơn 200 nhà khoa học trên toàn cầu, tập trung vào các lĩnh vực bao gồm AI, thị giác máy tính, ô tô tự lái, người máy và đồ họa.
Mình nghĩ nên bổ sung thêm họa sĩ vào 5 nghành nghề sẽ bị thay thế bởi AI nữa.