OpenAI Under Fire Following an Interview About Sora
在与伊隆·马斯克持续的战斗中,ChatGPT和DALL-E的开发者OpenAI再次陷入争议,这次是围绕其最近揭示的文本到视频AI模型Sora而展开的。
一个月前揭示的这个新视频生成扩散模型是团队努力的一部分,旨在教育人工智能理解和复制物理世界的动态。Sora由类似于GPT模型的变压器架构驱动,可以根据用户输入的文本提示生成1280x720分辨率的20秒视频。
当Sora揭示时,许多人心中的主要问题与常常提出给其他AI模型的问题相同:用于训练的数据是什么?这个问题预计会在《华尔街日报》最近发表的采访中得到答复,但不幸的是,由于OpenAI首席技术官米拉·穆拉蒂善于回避问题,情况并非如此。
在被问及用于训练Sora的数据时,穆拉蒂回答道,几乎与OpenAI的产品一样机械化和自动化,即该模型当然是基于公开可用和许可数据进行训练的。
看似预料到没有其他答案,采访者乔安娜·斯特恩进一步追问,要求首席技术官详细解释这个"公开可用和许可数据"口号背后的来源。在被问及是否利用YouTube、Facebook或Instagram视频进行训练时,穆拉蒂声称自己"对此不确定",这一言论在她作为首席技术官的身份下显然站不住脚。
在进一步询问关于Shutterstock图像的使用时,穆拉蒂坚决拒绝讨论Sora的训练,再次重申使用的数据是"公开可用和许可"的。有趣的是,穆拉蒂最终确认了Shutterstock材料的使用,但这发生在镜头外,并且仅在WSJ分享的脚注中才被揭示。
对于"不确定"评论的反应完全符合预期,成千上万的人在互联网上猛烈批评OpenAI。尽管目前很难否认各种AI开发者对材料的未经许可使用,但仍然有许多人认为首席技术官在这个问题上的回应令人愤慨,指责穆拉蒂撒谎。
那么,你认为呢?这是一个许多人轻易看穿的失败的欺骗尝试,还是OpenAI成功背后方法和秘密的笨拙保护方式?在评论中分享你的想法。
说到人工智能,昨天,欧盟最终以多数票通过了世界上第一个限制AI的法律 (opens new window)。这项新法案获得了523票赞成,46票反对和49票弃权的压倒性多数通过,该法案旨在通过根据AI系统的潜在风险和影响级别分配义务来保护人权。
不要忘记加入我们的80级人才平台 (opens new window),还有我们的电报频道和在Instagram、Twitter和LinkedIn关注我们,我们在那里分享解析、最新消息、精彩艺术作品等。