Google Gemini:是什么以及如何使用
2024 年 5 月 14 日

谷歌

谷歌的Gemini AI聊天机器人迅速成为生成式AI领域的主要参与者之一。尽管起步艰难,但Gemini是ChatGPT的少数真正竞争对手之一。以下是您需要了解的所有内容。

内容

谷歌最初在2023年3月以Bard的形式推出其AI计划,以免费和实验性的方式。该聊天机器人最初在LaMDA大型语言模型(LLM)上运行。

2023年8月,它推出了Google Duet作为一个企业选项,其中包括AI泛滥的Workspace应用程序,包括Gmail、Drive、Slides、Docs等。

然而,到了2023年12月,谷歌将Bard语言模型升级为Gemini LLM。到2月,它将Duet和Bard统一为一个产品,并将其所有AI选项重新打造为一个名称下,Gemini。

与ChatGPT一样,Google Gemini是一个AI聊天机器人,可以生成文本并回答问题,几乎可以做ChatGPT可以做的任何事情。

谷歌

谷歌正在将其Gemini生成式AI营销为特别强大,因为它的多模式功能使其能够在同一平台内执行诸如生成文本、图像、视频、音频和代码等任务。Gemini支持几种大型语言模型(LLM)选项,可用于不同层次的目的和专业知识,包括Gemini Nano、Gemini Pro、Gemini Ultra和Gemini Advanced。

谷歌有着使其AI在各种应用中变得有用的宏伟抱负。目前,它正在测试将Gemini集成到其Chrome浏览器 (opens new window)中。它之前也曾集成到谷歌的Workspace应用程序 (opens new window)中,包括Gmail、Drive、Slides、Docs等在企业级别。然而,Gemini AI聊天机器人本身在其最基本级别上仍然是免费的且易于访问。您只需登录或注册一个免费的谷歌账户即可。

谷歌最近推出了一个名为Google One AI Premium (opens new window)的付费层,适用于所有用户,并包括多项特权,除了由最新和最强大的LLM版本运行的Gemini聊天机器人。继续阅读以了解如何开始使用Google Gemini以及哪种Gemini选项可能适合您。

如何注册Google Gemini #

如果您想使用免费版本的Google Gemini,注册非常简单。许多人已经拥有谷歌账户和电子邮件。您只需使用您的谷歌凭据访问Gemini网站 (opens new window),然后您就可以开始使用了。如果需要的话,您可以在继续之前注册一个谷歌账户 (opens new window)

您可能会看到一些条款和服务通知,您可以自行阅读并确认。然后可能会有一个通知,说明Google Bard (opens new window)现在是Google Gemini。之后,您将会看到一个与大多数典型AI聊天机器人设置相似的页面。它包括一个个性化介绍、一些提示建议以及页面底部的提示文本框。

在左上角是一个Gemini下拉菜单,您可以刷新页面到一个新的聊天或选择升级到Gemini高级付费层的选项。最左侧是一个包含三条线的图标,让您可以展开菜单。在这里,您可以看到一个新的聊天选项卡,您最近的提示,一个帮助选项,活动选项,设置以及另一个升级到Gemini高级的选项。再次选择三条线图标以折叠菜单。

您可以在右上角看到您的谷歌账户图标。点击它可以查看您的谷歌账户详细信息和任何其他连接的账户。

开始使用提示 #

Google Gemini与许多其他AI聊天机器人类似,具有通过提示处理和生成不同类型文本的能力。谷歌用于潜在提示的一些示例包括解释具有挑战性的主题和活动规划。Gemini的其他常见用途包括故事和文章生成、语言翻译、代码生成和编辑以及解决数学方程等。您可以通过使用诸如“写”、“解决”、“总结”、“生成”、“创建”或“帮助我”等强有力的动作声明来开始一个提示,以表明您需要完成的任务,并提供尽可能详细的信息以确保获得最佳结果。

我使用的一个提示是“用简单的词汇教我相对论的理论”,Gemini给我返回了一个关于科学理论的详细、但仍然被截短的回应。它生成了三个可供选择的草稿,还建议我可以搜索有关该主题的其他方面的信息。

文本底部还有一个修改响应选项,您可以选择它,然后可以选择缩短或延长文本,或使其更随意或专业。您也可以通过输入手动提示来执行类似的功能。

我使用的另一个提示是“写一个关于圣诞老人与复活节兔子在玛丽·雪莱风格下相遇的短篇故事”,Gemini给我返回了一个关于尼古拉斯神父在他的工作室被Krampus摧毁后被兔子安慰的惊心故事。同样,我只选择了三个可用草稿中的第一个。在生成其他提示后,我意识到第一个是唯一剩下的,所以您在有机会时要查看选项。

我使用的另一个提示是“什么是最常见的CSS网格命令”,这给我返回了一份扎实的CSS命令列表和它们功能的解释。我探索了这个响应的一些草稿,以及一些包括的来源。

我还对词组“_狗跳过懒惰的狐狸”_进行了西班牙语、法语和中文的几种语言翻译,其中最后一个给我提供了不同方言的详细解释。 一些人们与AI一起使用的最令人敬畏的功能之一是利用详细的文本提示生成图像。 与文本转语音生成类似,使用诸如“创建”或“生成”之类的词语有助于聊天机器人知道您想要一个独特的结果,而不是从网络中提取某些内容。 此外,尽力避免在提示中出现拼写和语法错误,尽管有些错误可能会带来您不在意的有趣结果。 您可以随时编辑提示文本并重试。

首先,我使用了提示“生成一辆未来汽车驾驶穿过被大自然环绕的古老山路的图像”,这些图像具有让人愉快使用AI的逼真感。 我在Microsoft的Copilot聊天机器人中测试了相同的提示,虽然它显示了很好的结果,但它们看起来更像是绘画或画作。 它们非常出色,但是谷歌Gemini的图像中的汽车和风景并不像这样匹配。

接下来,我尝试了“狗在玩扑克牌”提示的各种变化,得到了一些引人入胜的结果。 有些是现代风格的。 有些是基于2000年代的。 有些是基于2020年的。 当我开始看到狗脸出现在人体上时,我决定停下来。

谷歌Gemini高级 #

Gemini Advanced是谷歌的付费聊天机器人版本,每月售价为20美元,并在Google One AI Premium (opens new window)订阅层中提供了许多特权。 Gemini Advanced运行Gemini Ultra 1.0语言模型,擅长理解较长的提示以及先前提示的上下文。

谷歌已将Gemini Advanced与启用AI的生产力应用程序捆绑在一起,包括Gmail、Docs、Sheets、Slides和Meet中的Gemini。 您还将获得2TB的存储空间、Google照片编辑功能、Google商店奖励的10%返现、Google Meet高级视频通话功能、Google日历增强的约会安排、Google One提供的VPN (opens new window)、暗网监控、Google商店返现的3%到10%以及额外的客户支持。

目前有一个Google One AI Premium的免费两个月试用优惠,让您可以无风险地测试Gemini Advanced。

谷歌Gemini扩展 #

扩展是Gemini内的一个有趣的快捷方式,允许您像使用超级搜索引擎一样使用聊天机器人。 在提示开头使用@提及符号,您可以将Gemini引导到一个应用程序或服务重点,无论是Google Flights、Hotels、Maps、Gmail、Drive、Docs还是YouTube。 然后,您将完成您想要完成的任务的提示。 这可以是在Google Docs中查找文件,总结YouTube上的视频,或在Google Flights中查找旅行选项。 只需确保通过访问_Settings > Extensions_打开所有您想要启用的扩展功能。

如何管理您的Gemini活动 #

许多人对生成式AI的一个抱怨是数据跟踪。 然而,谷歌正在尽最大努力通过提供易于访问的活动跟踪器来让用户放心,您可以随意启用或禁用数据跟踪,并在需要时删除您的数据。 一旦设置好您的设置,谷歌将无法访问您不允许的任何数据。 从此区域,您可以选择按小时、按天或按自定义范围删除单个提示。 还有自动删除设置,每隔三个、18个或36个月删除一次。 但是,如果您不想处理所有这些,请按照以下说明学习如何关闭数据并删除您的活动历史记录。

  • 选择左上角的Gemini以转到Google Gemini页面。
  • 选择左下角的活动时间形状图标。
  • 选择页面顶部的_Gemini应用活动_选项。
  • 选择_关闭_或_关闭并删除活动_。

编辑推荐 #