AI行业公开的秘密:都在抄作业
据国外媒体报道,多位开发者和创始人透露,许多初创公司的AI聊天机器人,极可能是采用OpenAI和其他公司的数据开发的。
这些机器人在某些特定领域可以媲美GPT-4,但收费只是OpenAI的一小部分。
初创公司抄袭OpenAI的具体做法是,先开通GPT-4的会员,然后向它提出一系列问题,然后使用这些问题和答案来训练自己的模型,并且采取这一策略的初创公司不在少数。
而且这些公司并未公开披露它们使用了OpenAI的技术,虽然OpenAI的CEO奥特曼曾表示,规模较小的企业可以适度利用该公司的技术。
但这种做法实质上损害了OpenAI的增长,奥特曼随时都有可能改变主意。
Unsloth AI联合创始人Daniel Han估计,他大约一半的客户从GPT-4或Anthropic的Claude模型中获取数据,并用它来改进自己的模型。
不仅如此,初创公司利用OpenAI数据训练模型的做法,与OpenAI等巨头的做法并无二致。
有媒体报道称,谷歌曾转录YouTube视频,Meta雇佣承包商总结受版权保护的书籍,Adobe使用Midjourney的AI生成照片,均是为了训练自家AI模型。