如何停止ChatGPT的语音功能打断你
2024 年 4 月 19 日

如何停止ChatGPT的语音功能打断您

最近,我在等待指甲干燥时,不想弄脏指甲油,我突然意识到这将是测试一些仅限语音的人工智能 (opens new window)功能的绝佳机会。硅谷的车主们正在开车时与ChatGPT (opens new window)进行长时间的对话,我也想在当天晚些时候与两位OpenAI (opens new window)产品负责人会面前尝试进行免提聊天。

尽管聊天机器人 (opens new window)对头脑风暴有所帮助,与ChatGPT来回交流就像是与一个咖啡因过剩的朋友合作,他甚至不能忍受一秒钟的沉默。在它打断我之前,我正在英勇地努力完成一个完整的思想。

我:去年我为我们的读者写了一封名为AI Unlocked的通讯。在那封通讯中,我……

ChatGPT:告诉我更多关于你的通讯以及与之相关的具体问题。

仅进行了几分钟的实验,我就经历了由合成语音引起的舞台恐惧,并请求与聊天机器人多交流,要求给我更多时间,请求在句子之间给我一点时间来思考。聊天机器人鼓励我放慢速度,尽管它的回复速度保持不变。

当我向ChatGPT提及与AI聊天时的焦虑时,ChatGPT的模型行为负责人Joanne Jang解释说,这是公司试图在AI模型中解决的用户体验方面的一个问题。“在我们理想的世界中,模型实际上会更好地检测到你何时完成。因此,如果你没有完成你的句子,它就不会打断你,”Jang说。“这是我们正在努力解决的问题,我们知道这是我们用户的痛点。”

在提到与AI聊天时的焦虑时,Joanne Jang建议用户一个简单的解决方案:只需轻触屏幕。只要您有一个手指空闲,您就可以在与ChatGPT的对话中轻触并按住中心的大圆圈。在说话时保持手指在那里,以避免任何机器人的干扰;当您真正完成您的语音提示后,可以放开手指。

尽管Nick Turley,一个ChatGPT产品负责人,表示他更喜欢使用应用中的来回对话功能(通过触摸耳机图标),但对于需要更多时间并希望慢下来的用户,或者发现AI对话的默认节奏有点尴尬的用户,他推荐了另一种可听的交互方法。

在移动应用中,点击麦克风图标,旁边是耳机图标。说出您想在提示中使用的任何内容,然后在完成后点击蓝色区域停止录音。ChatGPT会将音频转换为文本,并将其添加到提示字段。按下发送按钮后,通过长按输出并选择朗读,听ChatGPT的回复。这种放慢的过程是与AI工具以自己的节奏进行语音交互的一种愉快方式,对于那些可能会因服务的快速口头回应而感到紧张的人来说。

尽管存在缺陷,该工具已经比我以前与上一代语音助手,如Siri (opens new window)Alexa (opens new window)的任何互动都更具吸引力。自十多年前推出Siri以来,语音助手持续改进,但他们未能显著改变用户日常与技术互动的方式。我仍在笔记本上输入这篇文章,而不是将我的想法口述给Alexa。同样,我使用我的Google Nest Mini (opens new window)来播放音乐和设置厨房定时器,仅此而已。

OpenAI的两位产品负责人似乎急于引领ChatGPT的语音助手时代。Turley说:“我们希望将其更多地发展为一个助手。”“这意味着为您提供更自然的交谈方式。”ChatGPT很可能很快就能够与我的交谈节奏相匹配,并消除讨厌的中断。该公司最近宣布了一个独立的Voice Engine模型 (opens new window),只需一小段音频片段就能重新创建任何人的声音。例如,销售专业人员可能能够建立一个AI语音助手,以其言辞风格处理传入电话,或者悲伤的亲属可以创建一个合成模拟已故亲人的声音。

尽管ChatGPT在AI聊天机器人生态系统中占据主导地位,但OpenAI并不是唯一一家拥有独特的、由AI驱动的语音助手的公司。例如,Google Assistant (opens new window)在去年进行了生成式AI改头换面。Rabbit (opens new window)Humane (opens new window)都在尝试使用语音命令作为主要交互方式的AI硬件的概念。另一家初创公司Hume最近推出了情感为中心的软件预览,称为Empathic Voice Interface (opens new window),试图将AI的情感输出与其检测到的您语音提示中的语调相匹配;如果您行为愚蠢或忧郁,它会切换心情以反映您的心情。

生成式AI的进步 (opens new window)会引领语音助手实用性增加的另一个突破性时刻吗?2018年,WIRED高级记者Lauren Goode撰写了有关亚马逊Alexa的尴尬性 (opens new window):“当这些东西变得更有用时,我们可能不会注意到这一点。相反,技术将会在我们周围演变。”也许在语音助手成为我的日常例程的一部分之前,我不会意识到它们的重要性,但无论何时它们停止打断我,我都会立即注意到。