数据交易 —
2024 年 5 月 18 日

Reddit的数据交易 #

Reddit一直急于出售用户帖子的数据。

Reddit和OpenAI在周四宣布,Reddit上发布的内容将被纳入ChatGPT。这项新合作使OpenAI获得了Reddit的数据API访问权限,为这家生成式人工智能公司提供了Reddit帖子的实时访问。

Reddit的博客文章称,Reddit的内容将被纳入ChatGPT“和新产品”。这家社交媒体公司声称,这一合作将“使OpenAI的AI工具能够更好地理解和展示Reddit内容,尤其是关于最新主题的内容”。OpenAI还将开始在Reddit上进行广告推广。

这项交易类似于Reddit在2月与Google达成的一项协议,允许这家科技巨头“以新的方式展示Reddit内容”并提供“更有效的训练模型的方式”。Reddit表示,Reddit和Google的合作协议价值6000万美元。在OpenAI的合作协议下,Reddit还获得了OpenAI大型语言模型(LLMs)的访问权限,以为Reddit创建功能,包括其志愿版主。

Reddit的数据许可推动

这则消息大约是在Reddit推出API收费访问数据API一年后发布的。这导致许多备受喜爱的第三方Reddit应用关闭,引发了大规模用户抗议。Reddit即将上市,但尚未盈利,表示突然改变的原因之一是防止AI公司使用Reddit内容免费训练其LLMs。

本月早些时候,Reddit发布了一项公共内容政策,其中指出:“不幸的是,我们发现越来越多的商业实体使用未经授权的访问或滥用授权访问以大量收集公共数据,包括Reddit的公共内容。更糟糕的是,这些实体认为他们对该数据的使用没有任何限制,并且他们对用户权利或隐私毫不在意,无视合理的法律、安全和用户删除请求。

在周四的博客文章中,Reddit表示,像OpenAI这样的交易是“开放式”互联网的一部分。它补充说,“开放的一部分意味着Reddit内容需要对那些促进人类学习和研究建立在线社区、归属感和赋权的人员可及。”

Reddit一直公开表达了其有意将数据许可交易作为业务的核心部分的兴趣。其建立AI合作关系引发了关于利用用户生成内容来为AI模型提供动力而未对用户进行补偿,以及一些人可能并未考虑到他们的社交媒体帖子会被这样使用的讨论。本月早些时候,当OpenAI与Stack Overflow整合Stack Overflow内容与ChatGPT时,OpenAI也遭到了一些反对。Stack Overflow的用户社区中的一些人通过破坏自己的帖子来回应。

OpenAI也面临着与Reddit数据合作的挑战,就像互联网上的许多内容一样,可能充斥着不准确和不当的内容。Reddit的API规则变更的最大反对者之一是志愿版主。一些人已经退出了该平台,并且在规则变更后,Ars Technica与长期Reddit用户进行了交流,他们对Reddit的内容质量未来感到担忧。

尽管如此,生成式人工智能公司渴望利用Reddit对来自各种人讨论几乎无穷无尽的话题的实时对话的访问权限。Reddit似乎同样渴望获得其用户帖子的数据许可。

(Advance Publications是Ars Technica母公司Condé Nast的最大股东。)