苹果的 Siri 会变得更像 ChatGPT 吗?所有人都在关注苹果的 WWDC
2024 年 6 月 1 日

我们已经生活在一个虚拟助手可以与人进行无缝(甚至挑逗性的)对话的世界。但是苹果的虚拟助手Siri在一些基本问题上表现出了困难。

例如,我问Siri今年奥运会什么时候举办,它很快就给出了夏季运动会的正确日期。当我接着说“添加到我的日历”时,虚拟助手回答不完美,询问“我应该称它为什么?”这个问题的答案对我们人类来说是显而易见的。但苹果的虚拟助手却迷失了。即使我回答“奥运会”,Siri回答道:“我应该安排在什么时候?”

Siri往往会失误,因为它缺乏上下文意识,这限制了它像人类一样进行对话的能力。这种情况可能会在6月10日之前发生,这是苹果年度全球开发者大会(WWDC) (opens new window)的第一天。预计iPhone制造商将在即将推出的移动操作系统中进行重大更新,可能会被称为iOS 18 (opens new window),据报道Siri将进行显著改进。

苹果的虚拟助手在2011年随iPhone 4S (opens new window)首次亮相时引起轰动。人们第一次可以与他们的手机 (opens new window)交谈并得到类似人类的回应。在Siri之前,一些Android手机 (opens new window)提供了基本的语音搜索和语音操作,但那些更多是基于命令的,被普遍认为不够直观。

Siri代表了声音交互的一个飞跃,并为随后的语音助手奠定了基础,例如亚马逊的Alexa (opens new window)谷歌的助手 (opens new window),甚至OpenAI的ChatGPT (opens new window)谷歌的Gemini聊天机器人 (opens new window)

让位于Siri,多模态助手已经到来 #

虽然Siri在2011年以其基于语音的体验给人留下了深刻印象,但其功能被一些人认为 (opens new window)落后于同行。Alexa和Google助手擅长理解和回答问题 (opens new window),两者都以不同于Siri的方式扩展到智能家居。似乎Siri并没有充分发挥其潜力——尽管其竞争对手也受到了相似的批评。

在2024年,Siri还将面临截然不同的竞争环境,这已经被生成式人工智能推动到了极致。最近几周,OpenAI、谷歌和微软推出了一波具有多模态功能的未来虚拟助手,这对Siri构成了竞争威胁。根据纽约大学教授斯科特·加洛韦在他的播客的最新一集 (opens new window),这些最新的更新被认为将成为“Alexa和Siri的杀手”。

斯嘉丽·约翰逊和华金·菲尼克斯曾在2013年的一个电影节上出席了《Her》的首映式。快进到2024年,约翰逊指责OpenAI未经她许可复制了她的声音用于其聊天机器人。

在本月初,OpenAI展示了其最新的AI模型。这一公告凸显了虚拟助手已经取得的成就。在旧金山的演示中,OpenAI展示了GPT-4o如何以更加类似人类的方式进行双向对话,甚至能够改变语调、发表讽刺的言论、低语、甚至挑逗。这一技术展示迅速与2013年好莱坞电影《Her》中斯嘉丽·约翰逊饰演的角色进行比较,其中一位孤独的作家爱上了他由约翰逊配音的女声虚拟助手。在GPT-4o的演示之后,这位美国演员指责OpenAI创建了一个声音“骇人相似”的虚拟助手,而没有征得她的同意。Open AI表示,这个声音从未旨在模仿约翰逊的声音。

这场争议似乎掩盖了一些GPT-4o的特性,比如其原生的多模态功能,这意味着这个AI模型可以理解并回应超出文本之外的输入,包括图片、口语,甚至视频。

阅读更多斯嘉丽·约翰逊对OpenAI的聊天机器人模仿《Her》的声音感到“愤怒” (opens new window)

OpenAI的预览之后的第二天,谷歌展示了自己的多模态演示,推出了Project Astra (opens new window)——一个被公司誉为“人工智能助手未来”的原型。在演示视频中,谷歌详细介绍了用户如何通过使用手机相机向谷歌的虚拟助手展示他们的环境,然后继续讨论他们环境中的物体。例如,在与Astra互动的人在谷歌伦敦办公室询问谷歌的虚拟助手要识别房间里发出声音的物体。作为回应,Astra指出桌子上的扬声器。

谷歌展示了Astra在手机上的原型,也在支持摄像头的眼镜上展示。

谷歌

谷歌的Astra原型不仅能理解其周围环境,还能记住细节。当旁白问起他们放在哪里的眼镜时,Astra能够回答上次看到它们的地方,回答说“在桌子角上的一个红苹果旁边”。

创造华丽虚拟助手的竞争并没有随着OpenAI和谷歌结束。埃隆·马斯克的AI公司xAI正在努力将其Grok聊天机器人转变为具有多模态功能的聊天机器人,根据公开的开发者文件 (opens new window)。今年5月,亚马逊表示正在努力为Alexa,其有几十年历史的虚拟助手,提供生成式人工智能升级。

Siri将变成多模态吗? #

多模态对话聊天机器人目前是AI助手的前沿,可能提供了一个窥视我们如何导航手机和其他设备的未来的窗口。

苹果目前尚未拥有具备多模态功能的数字助手,这使其落后于潮流。 iPhone制造商已经开始加速其进程。 基于已发表的研究,苹果正在探索名为Ferret的多模态AI助手的功能。在这个示例中,助手展示了帮助用户导航应用程序的功能,Ferret可以执行基本任务和高级任务,例如详细描述屏幕。

苹果正在探索名为Ferret的多模态AI助手的功能。在这个示例中,助手展示了帮助用户导航应用程序的功能,Ferret可以执行基本任务和高级任务,例如详细描述屏幕。

苹果可能在隐私方面脱颖而出。iPhone制造商长期以来一直倡导隐私作为产品和服务设计的核心价值观,并将新版本的Siri定位为与竞争对手更私密的替代品,据《纽约时报》报道。预计苹果将通过在设备上处理Siri的请求并在需要更复杂任务时转向云端来实现这一隐私目标,但这些任务将在使用苹果自制芯片的数据中心中处理,根据《华尔街日报》的报道。

关于聊天机器人,苹果即将与OpenAI敲定交易,有望将ChatGPT带入iPhone,根据彭博社的报道,这可能表明Siri不会直接与ChatGPT或Gemini竞争。与其像写诗一样做事情,Siri将专注于它已经能够做的任务,并在这些任务上变得更好。

传统上,苹果一直有意缓慢进入市场,更愿意采取观望的方式看待新兴技术。这种策略通常起效,但并非总是如此。例如,iPad并不是第一款平板电脑,但对于许多人来说,包括CNET编辑在内,它是最好的平板电脑。另一方面,苹果的HomePod智能音箱比亚马逊Echo和谷歌Home晚了几年才上市,但从未赶上对手的市场份额。硬件方面的一个更近期的例子是可折叠手机。苹果是唯一的主要持有者。所有主要竞争对手——谷歌、三星、荣耀、华为甚至像Phantom这样的鲜为人知的公司——都比苹果更快推出了这款产品。

以往,苹果对Siri进行定期更新的做法,Techsponential的首席分析师Avi Greengart说。

“苹果一直对Siri的处理比亚马逊、谷歌甚至三星更加程序化,”Greengart说。苹果似乎会在某一时期向Siri添加新的知识——一年是体育,下一年是娱乐。

对于Siri,人们普遍预计苹果今年将追赶而不是开拓新局。尽管如此,Siri可能仍将是苹果即将推出的操作系统iOS 18的重点,据传将带来新的AI功能。预计苹果将展示更多的AI整合到现有应用程序和功能中,包括Notes、表情符号、照片编辑、消息和电子邮件。

至于Siri,今年有望发展为更智能的数字助手。据报道,苹果正在训练其语音助手使用大型语言模型,以提高其回答问题的准确度和复杂性。大型语言模型的整合,以及ChatGPT背后的技术,有望将Siri转变成一个更具上下文意识和强大的虚拟助手。这将使Siri能够理解更复杂和微妙的问题,同时提供准确的回答。今年的iPhone 16系列也有望提供更大的存储空间,以支持新的Siri功能。 观看此视频: 苹果在 WWDC 上的人工智能将有所不同

17 个隐藏的 iOS 17 功能,你绝对需要知道 #

查看所有照片 (opens new window)

编辑注:CNET 使用 AI 引擎帮助创建了数十个故事,这些故事均有相应标签。您正在阅读的注释附在与 AI 主题有实质性关联的文章中,但这些文章完全由我们的专业编辑和撰稿人创建。更多信息,请参阅我们的AI政策 (opens new window)