RTX AI PC将为各行业带来AIGC生产力革命
NVIDIA在近日举行的RTX AI媒体品鉴会上,宣布了大量AI相关内容更新,同时现场还展示了AI在PC领域的广泛应用:NVIDIA ACE、ChatRTX、Stable Diffusion、 DLSS 3.5、NVIDIA app以及来自众多AI艺术家基于RTX 40系列Al PC创作的AIGC作品。
NVIDIA加速了向Al计算的转变,于2018年推出RTX技术和首款专为Al打造的消费级GPU(GeForce RTX)。Al PC是搭载专用AI加速硬件的计算机,在RTX GPU上,这些专用的Al加速器被称为Tensor Core。运行要求极为严苛的工作和娱乐应用时,Tensor Core能够显著加速AI性能,如Stable Diffusion 1.5和SDXL等热门的生成式AI模型。NVIDIA TensorRT软件开发者套件可加速深度学习推理性能。
AI性能的量化体现
衡量Al性能的一种方法是以teraops为单位。teraops即“万亿次运算/秒"(TOPS),TOPS可作为单一指标让用户了解PC的Al性能,GeForce RTX 40系列GPU可提供的算力,涵盖从200 AITOPS到1200 AITOPS。与之相比,目前没有独立GPU的轻量级AI PC的算力仅为10至45 TOPS。
为方便用户对比,NVIDIA也将不同GPU的AI性能标注在官网上供大家查询。
全新的UL Procyon Al图像生成基准测试现已支持TensorRT加速,内部测试表明该基准测试可以比较准确地反映目前的实际性能表现。将Tensor Core 与TensorRT结合后,本地RTX AI PC可获得卓越的生成式Al性能。
RTX AI PC目前已成为拥有超过1亿用户和500款Al应用的生态。
游戏中的AI
NVIDIA DLSS是一项突破性图形技术,可在GeForce RTX GPU上利用AI提高帧率并改善图像质量。DLSS 3.5树立全新游戏标准,通过AI增强光线追踪表现,备受期待的《黑神话:悟空》和《永劫无间》即将支持DLSS 3.5光线重建和全景光线追踪技术,实现画质和性能的大幅提升,为GeForce玩家带来极致体验。
NVIDIA RTX Remix可让 Modder 轻松截取游戏素材,使用生成式AI工具自动增强材质,以及借助全景光线追踪和DLSS快速创建合人惊艳的RTX重制版游戏。
NVIDIA Freestyle 将通过全新的NVIDIA app Beta版提供,可让用户通过实时后处理滤镜个性化定制超过1200款游戏的视觉美学效果,并具有RTX HDR、RTX Dynamic Vibrance(RTX数字自然饱和度)等功能。
NVIDIA Broadcast应用可将任何房间变成家庭工作室,为直播提供AI增强型语音和视频工具,包括噪音和回音消除、虚拟背景和AI绿幕、面部追踪、视频降噪和目光接触。
NVIDIA ACE为游戏带来栩栩如生的NPC
非玩家角色 (NPC) 通常在电子游戏的剧情推进过程中起着至关重要的作用,但由于它们一般是为固定目的而设计,对话和动作早已提前设定,因此在交互中可能显得机械而无趣,尤其是在拥有数千个非玩家角色的广阔游戏世界中。
NVIDIA适时推出了NVIDIA ACE,为游戏开发者和数字创作者带来了制作逼真 NPC 的利器。开发者可通过 ACE 微服务将先进的生成式 AI 模型集成到游戏和应用内的数字虚拟形象中。通过 ACE 微服务,在交互的过程中,不仅能实现精确的语音转换文字,同时还能为NPC提供逼真的面部表情。NVIDIA ACE将认知、感知和行为系统集成在一起,在精心制作的环境中呈现今人惊叹的RTX渲染角色,以实现身临其境的叙事效果。
ChatRTX,听得更多,看得更多,聊得更多
ChatRTX使用检索增强生成技术,经由NVIDIA TensorRT-LLM软件和NVIDIA RTX加速,为 RTX Windows PC 和工作站带来聊天机器人功能。ChatRTX 运行在本地,用户可在 LLM 的支持下查询自己的笔记和文档,ChatRTX 将针对查询快速生成相关回应。
最近更新的ChatRTX版本中,不仅增加了对更多LLM大模型的支持,还加入了对语音、图像的交互支持。
创作中的AI应用
SD专业工作流:RTX 4090 D GPU在复杂的控制工作流和出图质量中表现出真正的生产力,通过人像生成控制模型,让用户足不出户就能通过搭载RTX 4090 D的RTX AI PC,将普通摄像头的自拍照生成高质量影棚级别的肖像照。而目前,RTX GPU能为Stable Diffusion用户带来生产力级别的体验。
SD一秒生成8张图:作为市面上最快的Stable Diffusion计算出图方案,用户能在RTX 4090 D GPU享受到高达每秒8张图的生成速度。使用当前最快的StableDiffusion加速方法TensorRT,再配合开发者进一步的性能优化,目前RTX 4090 D GPU最高能实现每秒超过100张图的生成速度。
声音克隆:基于 RTX GPU加速的声音克隆可仅用5秒录音来克隆声音,实现无需训练的个性化声音生成。基于开源的GPT-SoVITS项目,声音克隆根据5秒录音样本的发音特征由文本生成个性化语音片段,实现高质量的声音克隆,在RTX Al的加速下,这个过程仅仅五分钟就能完成;而基于更多样本(1分钟)的微调训练能够实现接近1:1复刻的声音克隆。
实时建筑渲染:在建筑设计领域,即致AI基于扩散模型和蒸馏技术,通过RTX GPU的加速,实现了秒级的Al实时绘画。结合即致Al自研的全网下载量超50W国内建筑行业大模型,帮助建筑设计师享受Al实时渲染划时代的快捷、便利的同时,依然可以保证极高的出图效果。
AI PC拐点已至,RTX独领风骚
毋庸置疑,AI PC的发展正在改变我们的日常生活和工作效率,全行业拥抱AI正在成为现实。在AI加速领域,NVIDIA独领风骚,地位超然。基于RTX GPU的AI应用计算加速不仅无出其右,更是拥有广泛的应用生态。可以毫不犹豫地说:RTX AI PC将为各行业带来AIGC生产力革命!