解码 GAN 如何掀起生成式 AI 革命浪潮

编者注:本文属于《解码 AI》系列栏目,该系列的目的是让技术更加简单易懂,从而解密 AI,同时向 NVIDIA RTX PC 和工作站用户展示全新硬件、软件、工具和加速特性。

[MD:Title]

随着以 ChatGPT 和 Stable Diffusion 为代表的热门应用不断涌现,生成式模型已彻底改变 AI 格局。

基础 AI 模型和生成式对抗网络 (GAN) 引发了生产力和创造力的飞跃,为生成式AI的爆发奠定了基础。

NVIDIA 的 GauGAN 是一种能够利用 AI 将手绘草图转换为写实风艺术作品的模型,可为 NVIDIA Canvas 应用提供支持。

GAN 如何为这一切拉开帷幕

GAN 是一种深度学习模型,它包含两个互补的神经网络:一个生成器和一个判别器。

这两个神经网络会相互竞争。生成器试图创建栩栩如生的写实图像,而判别器则试图区分真实图像和生成图像。随着这两个神经网络不断相互挑战,GAN 在绘制写实的图像方面的能力愈发纯熟。

GAN 擅长理解复杂的数据模式并创建高质量结果。它们被用于多种应用,包括图像合成、风格迁移、数据增强和图像到图像转换应用。

NVIDIA 的 GauGAN 以后印象派画家保罗·高更的名字命名,是一个用于生成写实风格图像的 AI Demo 演示。它由 NVIDIA 研究团队构建,直接促成了 NVIDIA Canvas 应用的开发。您可通过 NVIDIA AI 游乐园免费体验此 AI Demo。

自 GauGAN 于 2019 年在 NVIDIA GTC 大会上首次亮相以来,它一直广受欢迎,被艺术教师、创意机构、博物馆以及数百万网络用户所使用。

试着让抽象草图秒变逼真风景

在 GauGAN 和本地 NVIDIA RTX GPU 的支持下,NVIDIA Canvas 可利用 AI 将简单的笔画转变成逼真的风景画,并实时显示结果。

用户可以先运用具有草或云等现实元素(应用中称为“材质”)的调色板绘制简单的线条和形状。

[MD:Title]

然后,AI 模型会在另一半屏幕上实时生成增强的图像。例如,使用“山”材质勾勒出几个三角形形状,它们随即就会转变为令人惊艳的逼真山脉。用户也可以选择“云”材质,之后只需点击几下鼠标即可将环境从晴天变为阴天。

创意拥有无限可能。如果用户绘制了池塘的草图,图像中的树木和岩石等其他元素在水中的倒影便会随即生成;用户若将材质从雪变成草地,场景就会从惬意冬日转变为热带天堂。

[MD:Title]

Canvas 提供九种不同的风格,每种风格有 10 种变体和 20 种材质可供选择。

Canvas 设有全景模式,艺术家能够借此创建 360 度全景图像并将其用于 3D 应用。YouTube 博主 Greenskull AI 通过以下视频展示了全景模式。在视频中,他绘制了一个海湾并将其导入了 UE 5。

[MD:Title]

欢迎下载 NVIDIA Canvas 应用并开始使用。

不妨考虑探索一下 NVIDIA Broadcast,这是另一款 AI 赋能的内容创作应用,可将任何房间转变为家庭工作室。RTX GPU 用户可以免费获取 NVIDIA Broadcast。