OpenAI推出ChatGPT的DALL-E图像生成器的新功能

2024 年 4 月 4 日

OpenAI推出了ChatGPT的DALL-E图像生成器的新功能

OpenAI今天推出了DALL-E编辑器的新版本，这是包含在ChatGPT付费套餐中的人工智能图像生成器。

该功能基于一个名为DALL-E 3的AI模型，该公司于去年9月首次推出。几周后，OpenAI将该模型整合到了ChatGPT中。去年推出的DALL-E编辑器的原始版本使客户能够根据文本提示和视觉示例生成图像，并进行后续编辑。

今天的更新将使用户更容易编辑他们生成的图像。

在Cha tGPT-3，DALL-E编辑器可以通过与服务的其他功能相同的聊天机器人界面访问。界面顶部新增的“选择”按钮使用户可以突出显示他们希望编辑的特定图像部分。然后，他们可以输入描述他们希望进行的更改的自然语言指令。

例如，用户可以在森林照片中的树周围画一个圈，并让DALL-E编辑器将其移除。还可以更改图像中对象的设计或添加新的对象。OpenAI在详细介绍更新的知识库文章中解释说：“我们建议选择您打算编辑的区域周围的大空间，以获得更好的结果。”

公司的工程师还在这一时机添加了许多可用性功能。在DALL-E编辑器中，新增的撤消和重做按钮使用户可以快速取消使用选择工具突出显示的图像部分。客户还可以调整图像的纵横比。 DALL-E编辑器可在ChatGPT Pro中使用，这是ChatGPT面向消费者的付费版本，也可以在OpenAI为组织提供的两个更高级产品系列中使用。该功能在Web版和移动版均可访问。

DALL-E 3是该功能基于的AI图像生成器，是OpenAI在2021年首次推出的神经网络的第三个版本。它生成比以前版本更高质量的图像。它还可以更准确地遵循用户的指令，这一特性被归因于DALL-E 3的训练数据集。

该公司的研究人员对AI进行了大量图像和相应字幕的训练。据OpenAI称，其中95%的字幕是使用专为DALL-E 3开发的自定义语言模型生成的。这种语言模型生成相对较短的图像描述，仅详细描述一幅图像。 OpenAI 发现有助于 AI 训练的核心元素是年龄。

DALL-E 3 是该公司为多媒体生成任务开发的几个模型之一。其在该类别中的其他产品包括 Voice Engine，一个可以生成合成语音的 AI 系统，以及 Sora 文本到视频模型。DALL-E 3 是这三个产品中 OpenAI 唯一广泛提供的产品。超过15,000名CubeAlumni专家，包括亚马逊首席执行官安迪·贾西、戴尔科技创始人兼首席执行官迈克尔·戴尔、英特尔首席执行官帕特·盖尔辛格等许多杰出专家。

“CUBE对这个行业来说是一个重要的合作伙伴。你们真的是我们活动的一部分，我们非常感谢你们的到来，我知道人们也很欣赏你们创造的内容” - 安迪·贾西

谢谢您