NVIDIA版Sora曝光!每天疯狂爬取80年时长视频

据媒体报道,NVIDIA正在训练尚未向公众发布,内部命名为Cosmos的AI项目。

该项目旨在构建一个集合光传输、物理和智能模拟的先进视频模型,以支持Omniverse 3D世界生成器、自动驾驶汽车系统和数字人产品等下游应用。

内部文件显示,英伟达正在从Youtube和其他来源抓取视频,收集用于这一AI产品的训练数据。

为了收集训练视频,NVIDIA员工使用名为yt-dlp的开源 YouTube 视频下载器,能够通过虚拟机刷新IP地址,规避平台的反爬虫机制。

通过使用 20到30台虚拟机,NVIDIA每天疯狂地爬取相当于80年时长的视频。

然而,这一行为被指可能违反了版权法和平台的使用条款,尽管NVIDIA方面回应称其做法完全合法,但谷歌和奈飞均表示,未与NVIDIA达成内容提取协议,且平台服务条款禁止内容抓取。

NVIDIA版Sora曝光!每天疯狂爬取80年时长视频