大型语言模型（例如ChatGPT）作为研究助理-丹尼尔·勒米尔的博客

2024 年 4 月 27 日

大型语言模型（例如ChatGPT）作为研究助手-丹尼尔·勒米尔的博客

软件可以在大多数游戏中击败人类...从国际象棋到围棋，甚至扑克。像ChatGPT这样提供的大型语言模型GPT-4通过诸如ChatGPT之类的服务，使我们能够解决一类新问题。GPT-4可以在司法考试中击败90%的人类 (opens new window)。人工智能可以与数学奥林匹克竞赛选手匹敌 (opens new window)。

学者的主要技能与语言相关：综合，类比，推断等。学者分析文献，找出漏洞，并提出研究问题。他们审查和综合现有研究。他们撰写研究论文，资助提案和报告。能够产生结构良好和语法正确的散文是学者的重要技能。

毫不奇怪，软件和人工智能可以帮助学者，并在某些情况下可能取代他们。梁等人发现 (opens new window)，越来越多的研究论文是用像GPT-4这样的工具撰写的（在某些领域高达18%）。可以非常肯定的是，在不久的将来，大多数研究论文将在人工智能的帮助下撰写。我怀疑它们也将被人工智能审查。我们可能很快将面临一个封闭循环，软件撰写论文，而其他软件对其进行审查。

我鼓励学者立即应用人工智能进行任务，例如…

查询文档。Microsoft的BingChat等工具允许您打开PDF文档并对其进行查询。您可以问“这项研究的主要发现是什么？”或“这项工作有什么实际应用？”。 改善文本。许多学者，包括我自己，将英语用作第二语言。当然，大型语言模型可以进行翻译，但它们也可以改进您的措辞。它不仅仅是语法检查器：它可以重写您文本的一部分，同时纠正不良用法。 创意生成。我过去花了很多时间与同事聊天，讨论我拥有的模糊想法。“我们如何检验X是否属实？”像ChatGPT这样的工具可以帮助您入门。如果您想知道如何设计一个实验来验证给定的假设，它通常能够做出出人意料的出色工作。 资助申请。您可以使用ChatGTP等工具帮助您进行资助申请。询问它制定短期和长期目标，勾勒方法论并讨论您的工作影响...它将立即提出可靠的东西。很可能已经有成千上万的资助申请是由人工智能撰写的。 编写代码。您可能不是程序员，但您想要一个R脚本，可以从Excel电子表格中加载数据并进行统计分析？ChatGPT会为您做到。 查找审稿人和期刊。有时您已经完成了一些工作，您希望帮助挑选合适的期刊，像ChatGPT这样的工具可以帮助。如果您的学生完成了论文，ChatGPT可以帮助您确定潜在的审稿人。

我怀疑很快学术工作将大大受益于人工智能，以至于以前需要整个研究所才能完成的工作，现在只需要少数学者即可完成。

这种新技术应该使平庸的学者相对更不那么有用。如果人工智能可以撰写可信的论文和资助申请，那么一个几乎无法做到这些事情的人的价值是多少？

您可能认为这些技术进步应该加速进步。但是，正如Patrick Collison和Michael Nielsen所认为的，尽管我们在技术方面取得了进步，科学生产力却在下降。今天的物理学进展速度不比20世纪上半叶更快。从相对的角度来看，它甚至可能是停滞的。我不认为我们应该草率地得出ChatGPT会在某种程度上加速物理学进展的结论。正如Clusmann等人所指出的：它可能仅仅减轻科学不端行为 (opens new window)。我们很快可能会被自动生成的文件海所淹没。Messeri和Crockett以优雅的方式表达了这一点：

科学AI工具可能引入一种科学探究阶段，我们会生产更多，但了解更少

然而，有理由保持乐观。通过让少数研究人员高效率地工作，通过减少资金来进一步探索，我们可能正在进入一个新的科学进步时代。但是，它可能无法直接使用我们的传统工具进行衡量。它可能不会表现为更多被引用的论文或通过大额资助。一个很好的例子是Hugging Face (opens new window)，一个站点，来自世界各地的成千上万的工程师探索新的人工智能模型。这种工作无疑是科学研究：我们有指标，假设，测试，可重现性等。但是，它看起来不像“学术工作”。

无论如何，传统学者将面临越来越大的挑战。具有讽刺意味的是，水管工和电工不会那么容易被替代，有时被归因于Moravec悖论。Steven Pinker在1994年写道，与股市分析和工程师不同，厨师和园丁的工作可以保障几十年不受影响。但我怀疑这个原则甚至在学术界内部也适用：一些工作，如进行实际实验，比制作和运行模型更难自动化。理论工作可能受人工智能的影响更大，而不是更应用、更具体的工作。

注：本博客文章并非由人工智能撰写。请期待拼写错误和语法错误。

丹尼尔·勒米尔，“大型语言模型（例如ChatGPT）作为研究助手”，收录于《丹尼尔·勒米尔的博客》，2024年4月27日。