ChatGPT Creator OpenAI因一次关于Sora的采访而备受争议

2024 年 5 月 12 日

OpenAI Under Fire Following an Interview About Sora

在与伊隆·马斯克持续的战斗中，ChatGPT和DALL-E的开发者OpenAI再次陷入争议，这次是围绕其最近揭示的文本到视频AI模型Sora而展开的。

一个月前揭示的这个新视频生成扩散模型是团队努力的一部分，旨在教育人工智能理解和复制物理世界的动态。Sora由类似于GPT模型的变压器架构驱动，可以根据用户输入的文本提示生成1280x720分辨率的20秒视频。

当Sora揭示时，许多人心中的主要问题与常常提出给其他AI模型的问题相同：用于训练的数据是什么？这个问题预计会在《华尔街日报》最近发表的采访中得到答复，但不幸的是，由于OpenAI首席技术官米拉·穆拉蒂善于回避问题，情况并非如此。

在被问及用于训练Sora的数据时，穆拉蒂回答道，几乎与OpenAI的产品一样机械化和自动化，即该模型当然是基于公开可用和许可数据进行训练的。

看似预料到没有其他答案，采访者乔安娜·斯特恩进一步追问，要求首席技术官详细解释这个"公开可用和许可数据"口号背后的来源。在被问及是否利用YouTube、Facebook或Instagram视频进行训练时，穆拉蒂声称自己"对此不确定"，这一言论在她作为首席技术官的身份下显然站不住脚。

在进一步询问关于Shutterstock图像的使用时，穆拉蒂坚决拒绝讨论Sora的训练，再次重申使用的数据是"公开可用和许可"的。有趣的是，穆拉蒂最终确认了Shutterstock材料的使用，但这发生在镜头外，并且仅在WSJ分享的脚注中才被揭示。

对于"不确定"评论的反应完全符合预期，成千上万的人在互联网上猛烈批评OpenAI。尽管目前很难否认各种AI开发者对材料的未经许可使用，但仍然有许多人认为首席技术官在这个问题上的回应令人愤慨，指责穆拉蒂撒谎。

那么，你认为呢？这是一个许多人轻易看穿的失败的欺骗尝试，还是OpenAI成功背后方法和秘密的笨拙保护方式？在评论中分享你的想法。

说到人工智能，昨天，欧盟最终以多数票通过了世界上第一个限制AI的法律 (opens new window)。这项新法案获得了523票赞成，46票反对和49票弃权的压倒性多数通过，该法案旨在通过根据AI系统的潜在风险和影响级别分配义务来保护人权。

不要忘记加入我们的80级人才平台 (opens new window)，还有我们的电报频道和在Instagram、Twitter和LinkedIn关注我们，我们在那里分享解析、最新消息、精彩艺术作品等。