OpenAI 为 ChatGPT 添加语音和图像功能
2023 年 9 月 25 日

凤凰新闻报道,OpenAI表示,通过键入与ChatGPT交流的日子即将结束。

这家人工智能(AI)公司表示,根据9月25日星期一的一篇博客文章,它正在为其生成式AI聊天机器人引入新的语音和图像功能,让用户进行语音对话或向AI展示他们所谈论的内容。

该文章称:“ChatGPT现在可以看到、听到和说话。”

“语音和图像为您在生活中使用ChatGPT提供了更多的方式,”它补充道。“在旅行时拍摄一座地标的照片,并进行关于它有趣之处的实时对话。当您回到家时,拍摄冰箱和储物柜的照片,以确定晚餐的食材(并根据步骤提问以获取食谱)。”

OpenAI将在接下来的时间内向Plus用户和企业用户提供ChatGPT的语音和图像功能。 两周后,根据这篇文章,语音将在iOS和Android上可用,而图像将对所有平台的用户提供选项。

OpenAI的更新是在几家大型科技公司投资于AI助手的背景下进行的。

例如,据报道,苹果每天花费数百万美元来构建其产品团队的生成AI能力,该举措的重点是为苹果的Siri语音助手进行下一代AI升级。

PYMNTS在9月7日写道:“嵌入式语音工具迫切需要这样的升级。”“当今大多数语音助手,包括亚马逊和谷歌的语音助手,仍然难以超越播放音乐、开关灯等核心应用。” 智能语音助手正在面临压力。谷歌和亚马逊上个月宣布,他们的语音助手Google Assistant (opens new window)Alexa (opens new window)现在可以同时在同一台设备上使用,这是来自哈曼的JBL (opens new window)智能音箱的新产品线。

PYMNTS Intelligence发现,消费者对于语音技术的可靠性和安全性可能还存在疑虑,尽管随着AI技术变得更加智能、更加普及,以及更加融入日常生活,这种观点可能会发生变化。

根据报告《消费者希望如何在语音时代生活中》,语音助手可以告诉所有者天气或股票价格,并直接从网站中传递其他信息。即使是语音激活的连接商业领域,也尚未被现有平台充分开发利用。 “经济”:根据《PYMNTS如何消费者想要在声音经济中生活——2023年4月》一文,54%的消费者表示,他们将来更喜欢使用语音技术,因为它比打字或使用触摸屏更快。

要获取有关所有PYMNTS人工智能的报道,请订阅每日的《人工智能简报》。