ChatGPT,Google和Meta希望拥有你的下一个旅行
2024 年 5 月 23 日

生成人工智能在过去几周取得了重大进展,这是自18个月前出现以来最显著的进步之一。

OpenAI、Google和Meta每个人在今年春季发布了更新的AI模型。他们都展示了他们如何将他们的聊天机器人视为个人助手,可以理解文本、视频、照片和音频。

他们每个人都使用了与旅行相关的示例,展示了他们希望用户采用这些助手的方式 - 潜在地削弱了那些基于OpenAI和Google技术构建自己产品的旅行公司。

这个话题将是Skift首届数据和AI峰会 (opens new window)讨论的一部分,将于6月4日在纽约市举行。像微软的Shane O’Flaherty和旅行规划初创公司专家Gilad Berenstein等演讲者将讨论行业如何采用AI,以及它尚未采用的方式。

一些初步测试显示,OpenAI最新的生成AI模型仍会产生事实错误(他们承认了这一点),就像其他模型一样。

但重点在于这些公司正在不断进步,未来的高科技数字旅行礼宾服务员离我们更近了一步。

以下是关于这些AI聊天机器人 - ChatGPT、Gemini和Meta AI - 如何成为更好的翻译工具、导游和旅行规划者的详细示例和分析。

Skift已经测试了一些方面,但并非所有方面都已经可用。

语音翻译 #

OpenAI将在未来几周推出新的语音翻译功能,这将为国际旅行者开启新的目的地。

这是因为ChatGPT移动应用的机器人声音 - 几乎与人类一样 - 将充当翻译,根据演示。

自2023年以来,移动用户已经能够与ChatGPT进行语音对话,但与OpenAI接下来推出的功能相比,今天的功能还相对简单。

新的语音机器人将能够理解非语言暗示,如呼气和语调,被打断时暂停倾听,并能识别群体对话中的不同声音。

OpenAI还表示,它可以改变语调 (opens new window)(比如更兴奋或讽刺地说话),唱歌和笑。根据演示,它似乎还可以用正确的口音说其他语言,而现有的声音听起来似乎总是带有美国口音。

这可能打破语言障碍,使旅行者能够访问某些目的地。

现有的文本翻译工具,如Google翻译,在能力上受到严重限制。除了笨拙外,它们往往在普通语言之间也无法正确翻译,通常会误解俚语和成语。对于罕见语言,它们几乎是无用的。

ChatGPT语音机器人今天听起来像人类,但基本上是通过听声音、将其转换为文本、翻译文本,然后大声朗读翻译 - 这些步骤会使它减速并可能导致故障。

即将推出的版本仅支持语音,OpenAI展示了这使得其响应变得即时,就像与人类交谈一样。

在一次简短的Skift测试中,现有的聊天机器人能够理解和翻译匈牙利语、加泰罗尼亚语和海地克里奥尔语的片段 - 这三种相对不常见的语言。它还能够理解墨西哥俚语、解释其含义,并提供何时适合使用的上下文。OpenAI表示,ChatGPT的语言能力正在变得更强。

OpenAI发布了一篇博文 (opens new window),展示了多个演示如何运行。在同一篇文章的底部,它还展示 (opens new window)了聊天机器人可能遇到问题的地方。

Google表示将在今年夏天为Gemini推出类似的语音功能,尽管它尚未展示这项技术。

视觉翻译 #

OpenAI和Meta都在推动其技术的视觉翻译能力。他们都使用了翻译菜单的示例。

当餐厅没有旅行者母语的菜单时,这种工具可以成为一个重要的问题解决者。即使对于讲另一种语言相当流利的人来说,解读菜单也可能很困难,因为菜单中经常包含在日常生活中不常用的词语。

OpenAI在博文 (opens new window)中表示,用户现在可以拍摄菜单的照片,并要求ChatGPT进行翻译,同时提供有关菜肴的文化信息,并推荐要点什么。

Skift在ChatGPT移动应用上进行了简短测试,翻译对于照片和PDF文件来说工作得相当好 - 虽然并非完美。用户可以就陌生的菜肴或成分提出问题。

Meta也强调了这种能力,最近在其Ray-Ban Meta智能眼镜的最新版本发布时也提到了这一点 - 尽管Skift尚未对其进行测试。如果用户在法国旅行需要帮助翻译菜单,这些眼镜可以显示翻译的文本,无需查看手机屏幕,Meta表示。

导游 #

OpenAI、Google和Meta都表示,他们的聊天机器人将能够实时查看和倾听周围环境。这本质上可以将它们变成虚拟导游。

“我们对Gemini应用的愿景是成为最有帮助的个人AI助手,通过直接访问Google最新的AI模型,”Google副总裁兼Gemini体验总经理Sissie Hsiao在上周的一次会议上表示。

Meta最近宣布已整合最新的Meta AI模型到Ray-Ban Meta智能眼镜 (opens new window)中。甚至在上个月的一次财报电话中,马克·扎克伯格将这款眼镜描述为“AI助手”:“您可以让它们看到您看到的东西,听到您听到的声音。因此,他们可以全面了解您周围发生的情况,同时帮助您完成您正在尝试做的事情。”

科技影响者Cleo Abram在一个与Meta和Ray-Ban付费合作的广告中展示了 (opens new window)它们如何在纽约充当导游。

在看着华盛顿纪念碑的眼镜中她给出的提示:“嘿,Meta:看一看,告诉我,那座纪念碑的历史是什么?”

聊天机器人的声音回应:“这是为了纪念乔治·华盛顿就任总统100周年而建立的。”

另一个问题:“嘿,Meta:看一看,告诉我,那是哪座教堂?”

回应:“这座建筑的名称是华盛顿广场卫理公会教堂。”

ChatGPT和Gemini在今年晚些时候才能读取实时视频,但它们可以查看照片。

Skift的测试表明,ChatGPT表现得相当不错。虽然并非无所不知,但它可以利用上下文做出合理的猜测。

一张奥兰多国际机场内部中庭的照片导致了这样的回应:“这张图片似乎是在一个大型建筑的中庭内拍摄的,可能是机场航站楼或酒店。棕榈树、喷泉和带阳台的多层建筑表明这可能是美国佛罗里达州奥兰多国际机场。这个地点的建筑和室内景观是其独特特色。”

ChatGPT关于奥兰多国际机场中庭内部的照片的测试。来源:Skift

这里还有ChatGPT关于瓦伦西亚烩饭的背景描述,它准确地描述了烩饭中包含兔肉、鸡肉、一种绿豆和蜗牛。

[](https://skift.com/wp-content/uploads/2024/0 来源:Skift

另一方面,Gemini 目前在识别照片方面表现不佳。当询问同一张照片时,回答是:“抱歉,我目前无法帮助识别人物的图片。”

Gemini 在识别照片方面的测试。来源:Skift

重新构想的搜索和旅行规划 #

上周,Google 展示了三个具体示例 (opens new window),展示了它如何通过 Gemini 和传统搜索栏投资于人工智能驱动的旅行规划。

与竞争对手相比,这是一项重大举措,表明 Google 一心帮助客户规划旅行,而不仅仅是预订。

付费的 Gemini 高级平台的旅行规划功能尚未发布,但 Skift 已经开始测试 (opens new window)重新构想的搜索栏如何运作。它可能有些挑剔,但这清晰地展示了 Google 的搜索结果将来会是什么样子:AI 生成的摘要在顶部和整个页面中,中间还会有一些列表和视频,中间穿插着更少的传统链接。

Meta 也在推动其升级后的聊天机器人的旅行规划能力。Meta AI 聊天机器人现在可以在 Messenger、Whatsapp 和 Instagram 的群聊中回答旅行问题。因此,如果一个群体在 Whatsapp 上共同规划一次旅行,某人可以请 Meta AI 建议在一个新城市做些什么,或者分享航班可用性信息。

自 2022 年首次发布生成式人工智能以来,旅游专家预测 (opens new window),Google 和其他大公司将成为最大赢家,而小型酒店和旅行社可能会遭受最严重影响,因为他们的网站被推到了页面底部。

对于互联网流量较低的旅游公司,如目的地营销组织,重新构想的搜索可能是最后的致命一击,除非他们重新思考如何运营。

结论 #

OpenAI 在创建可以充当导游的虚拟个人助手方面走在最前面。

Google 在创建与预订选项集成的有用的旅行规划工具方面走在最前面。

Meta 的眼镜提供了一个有趣的数字导游选项,但由于它们是眼镜,限制了用户可以使用它们做什么。而且由于 Meta AI 通过 Whatsapp 和其他应用程序目前还不能查看照片,因此这个聊天机器人在成为全方位有用助手方面最落后。