OpenAI大反击!称纽约时报涉嫌故意操纵,且数据是「合理使用」

OpenAI大反击!称纽约时报涉嫌故意操纵,且数据是「合理使用」

 

大家好我是二狗。

 

《纽约时报》向法院起诉OpenAI侵犯版权后续事件来了!

 

就在今天,OpenAI进行了一场“危机公关”:直接在官方博客上撰文发声,反驳《纽约时报》的诉讼,其主要观点有四个:

 

1、我们正在和新闻机构积极合作,共同探索新的机会;

2、使用公开可用的互联网材料训练AI模型是合理使用的,但我们仍然为机构提供选择退出的机会,因为这是合乎道德的做法;

3、“信息再现”是一种罕见的bug,我们正在努力将其减少为零;

4、《纽约时报》没有讲述事情的全貌;

 

 

 

下面二狗就来看看OpenAI具体是如何展开这4点进行“危机公关”的。

 

正在和新闻机构合作并探索新的机会

 

OpenAI 表示:“我们在技术设计过程中支持新闻机构,已经会见了现实家新闻机构以及像新闻/媒体联盟这样的领先行业组织,探索机会、讨论他们的担忧,并提供解决方案。我们的目标是学习、教育、理解反馈并适应。”

 

OpenAI称其目标是支持健康的新闻生态系统,成为良好的合作伙伴,并创造互利的机会。基于这一点,OpenAI下面与新闻机构建立了伙伴关系,以实现这些目标:

 

· 使用我们的产品来帮助记者和编辑处理繁琐的任务,例如分析庞大的公共记录和翻译新闻。

· 通过对额外的历史、非公开内容进行训练,储存我们的人工智能模型关于世界的知识。

· 在ChatGPT中展示实时内容并进行版权标记,为新闻出版商提供与读者连接的新方式。

 

OpenAI 称与美联社、美国新闻项目和纽约大学的早期合作为他们的方法提供了一个参考。

 

二狗点评:

这是危机公关的常用手段,要学会美化自己,表示自己已经做了很多合作的努力。

 

使用公开可用的互联网材料训练AI模型是合理使用的

 

OpenAI针对给出的三条“有理有据”的解释:

 

1、使用公开可用的互联网材料训练AI模型是合理使用,这一点得到了长期和广泛接受的先例支持。这一原则对创作者公平,对创新者必要,对美国竞争至关重要。

 

二狗点评:

说实话二狗第一次看到 OpenAI 的这个观点时是震惊的,因为总感觉「合理使用」这个词听起来非常相似,好像在哪里见过一样。另外 OpenAI 这个厉害波啊,直接上升到了国家高度,合着不会让白嫖训练数据就影响到了美国的交易,高啊在很高。

 

 

  

2、训练人工智能模型合理使用的原则得到了广泛的学者、图书馆协会、民间社会团体、前沿公司、领先的美国公司、创作者、作者等的支持,他们最近向美国版权办公室提交了评论。其他地区和国家,包括欧洲联盟、日本、新加坡和以色列,也有允许在受版权保护的上训练模型的法律——这对人工智能创新、进步和投资是一个优势内容。

 

二狗点评:

OpenAI先是说训练AI模型的这种“合理使用”一直都是大家支持和默认的,怎么到我这里来就不行了呢?其他其他国家也都是在法律上允许的呀!哼气!

 

3、话虽如此,法律权利对我们来说不如履行公民权利。我们在为出版商提供简单的退出流程方面引领了人工智能行业,以阻止我们的(爬虫)工具访问他们的网站,而且《纽约时报》在 2023 年 8 月采用了这一流程。

 

二狗点评:

OpenAI 这下当起了乖宝宝:别看合理使用的训练数据都是合法的,但我们也为出版商做出了退出流程,我们想的多周到啊!

 

“再现”是我们正在努力消除的罕见错误

 

OpenAI:

 

·我们的模型设计和训练是为了学习概念,以便解决新问题。我们采取了措施来限制不经的记忆并防止模型输出中再现。

·但是《纽约时报》精心编造我们的模型来重现他们的文章是对我们技术的不适当使用,违反了我们的使用条款。

· 就像人类获得广泛的教育和学习如何解决新问题一样,我们希望我们的人工智能模型观察世界信息的范围,包括来自多种语言、文化和行业。因为模型来自人类知识的巨大总和中学习,任何一个领域——新闻——都是训练数据的一部分,任何单一数据来源包括《纽约时报》对模型预期的学习都不重要。

 

二狗点评:

OpenAI开始甩锅了:文章复现只是技术bug、《纽约时报》涉嫌主板来输出内容复现、《纽约时报》的文章对AI模型的学习根本不重要。

 

《纽约时报》隐瞒了完整的故事

 

OpenAI:

 

我们与《纽约时报》的讨论似乎一直在我们上一次通信(12月19日)上取得建设性的进展。谈判的重点是围绕ChatGPT在实时展示和版权标记中建立了高价值的合作关系,其中《纽约时报》将获得与现有和新读者联系的新方式,我们的用户将获得对他们的报道访问。我们向《纽约时报》解释说,就像任何单一来源一样,他们的训练内容对我们现有模型的训练并没有多大贡献,也不会对未来产生足够的影响。他们在 12 月 27 日提起的提案(我们是通过阅读《纽约时报》了解的)对我们来说是一个答复和清醒。

 

在此过程中,他们曾提到看到了他们的一些内容的再现,但又拒绝分享任何示例,尽管我们致力于调查并解决了任何问题。例如,在 7 月,我们得知 ChatGPT 的一个功能可能以同样的方式复制实时内容之后,我们立即关闭了该功能,这表明我们非常重视这一优先事项。

 

许多有趣的是,《纽约时报》引发的重现似乎来自多年前的文章,这些文章经常在多个第三方网站上传播。看来他们故意收集提示,即使包括文章的长篇摘录,也能让我们的模型重现。使用这样的提示,我们的模型通常不会像《纽约时报》暗示的那样行为,这表明他们或指示模型重现,或者试图从中提取他们的样本。

 

尽管他们这种误判不是典型的或被的用户活动,也不是《纽约时报》的替代产品。无论如何,我们正在不断使我们的系统对抵御敌对攻击以再现训练数据来增强抵抗力,并且在我们最近的模型中已经取得了很多进展。

 

我们认为《纽约时报》的诉讼并不符合。因此,我们仍然希望与《纽约时报》建立建设性的合作关系,并尊重其长期历史,其中包括60多年前报道第一个工作神经网络以及维护第一个修正案自由。

 

我们着眼于与新闻机构的持续合作,通过实现人工智能的变革潜力,帮助提升他们产生高质量期待新闻的能力。

 

二狗点评:

我们OpenAI是好人:但是我们一直在和《纽约时报》积极沟通,无意中被他们反驳头起诉了我们,我们很震惊,而且我们再次声明《纽约时报》的训练文章对我们的ChatGPT的构建毫无帮助,但我们还是很重视,打架做了很多事。但不管怎么样,作为AI老大哥,我们很有气的!我们仍然希望与《纽约时报》建立建设性的合作!大家快来夸我吧!

 

最后,以上点评仅代表二狗个人观点,欢迎大家各抒情己见~

相关新闻

联系我们

联系我们

13276019273

邮件:siyushenqi@gmail.com

工作时间:周一至周五,9:30-18:30,节假日休息

添加微信
添加微信
Telegram
分享本页
返回顶部
私域神器:一站式全网全渠道拓客营销软件
销售热线:173 5412 3667 (←点击添加微信)