大型语言模型(例如ChatGPT)作为研究助手-丹尼尔·勒米尔的博客
软件可以在大多数游戏中击败人类...从国际象棋到围棋,甚至扑克。像ChatGPT这样提供的大型语言模型GPT-4通过诸如ChatGPT之类的服务,使我们能够解决一类新问题。GPT-4可以在司法考试中击败90%的人类 (opens new window)。人工智能可以与数学奥林匹克竞赛选手匹敌 (opens new window)。
学者的主要技能与语言相关:综合,类比,推断等。学者分析文献,找出漏洞,并提出研究问题。他们审查和综合现有研究。他们撰写研究论文,资助提案和报告。能够产生结构良好和语法正确的散文是学者的重要技能。
毫不奇怪,软件和人工智能可以帮助学者,并在某些情况下可能取代他们。梁等人发现 (opens new window),越来越多的研究论文是用像GPT-4这样的工具撰写的(在某些领域高达18%)。可以非常肯定的是,在不久的将来,大多数研究论文将在人工智能的帮助下撰写。我怀疑它们也将被人工智能审查。我们可能很快将面临一个封闭循环,软件撰写论文,而其他软件对其进行审查。
我鼓励学者立即应用人工智能进行任务,例如…
查询文档。Microsoft的BingChat等工具允许您打开PDF文档并对其进行查询。您可以问“这项研究的主要发现是什么?”或“这项工作有什么实际应用?”。 改善文本。许多学者,包括我自己,将英语用作第二语言。当然,大型语言模型可以进行翻译,但它们也可以改进您的措辞。它不仅仅是语法检查器:它可以重写您文本的一部分,同时纠正不良用法。 创意生成。我过去花了很多时间与同事聊天,讨论我拥有的模糊想法。“我们如何检验X是否属实?”像ChatGPT这样的工具可以帮助您入门。如果您想知道如何设计一个实验来验证给定的假设,它通常能够做出出人意料的出色工作。 资助申请。您可以使用ChatGTP等工具帮助您进行资助申请。询问它制定短期和长期目标,勾勒方法论并讨论您的工作影响...它将立即提出可靠的东西。很可能已经有成千上万的资助申请是由人工智能撰写的。 编写代码。您可能不是程序员,但您想要一个R脚本,可以从Excel电子表格中加载数据并进行统计分析?ChatGPT会为您做到。 查找审稿人和期刊。有时您已经完成了一些工作,您希望帮助挑选合适的期刊,像ChatGPT这样的工具可以帮助。如果您的学生完成了论文,ChatGPT可以帮助您确定潜在的审稿人。
我怀疑很快学术工作将大大受益于人工智能,以至于以前需要整个研究所才能完成的工作,现在只需要少数学者即可完成。
这种新技术应该使平庸的学者相对更不那么有用。如果人工智能可以撰写可信的论文和资助申请,那么一个几乎无法做到这些事情的人的价值是多少?
您可能认为这些技术进步应该加速进步。但是,正如Patrick Collison和Michael Nielsen所认为的,尽管我们在技术方面取得了进步,科学生产力却在下降。今天的物理学进展速度不比20世纪上半叶更快。从相对的角度来看,它甚至可能是停滞的。我不认为我们应该草率地得出ChatGPT会在某种程度上加速物理学进展的结论。正如Clusmann等人所指出的:它可能仅仅减轻科学不端行为 (opens new window)。我们很快可能会被自动生成的文件海所淹没。Messeri和Crockett以优雅的方式表达了这一点:
科学AI工具可能引入一种科学探究阶段,我们会生产更多,但了解更少
然而,有理由保持乐观。通过让少数研究人员高效率地工作,通过减少资金来进一步探索,我们可能正在进入一个新的科学进步时代。但是,它可能无法直接使用我们的传统工具进行衡量。它可能不会表现为更多被引用的论文或通过大额资助。一个很好的例子是Hugging Face (opens new window),一个站点,来自世界各地的成千上万的工程师探索新的人工智能模型。这种工作无疑是科学研究:我们有指标,假设,测试,可重现性等。但是,它看起来不像“学术工作”。
无论如何,传统学者将面临越来越大的挑战。具有讽刺意味的是,水管工和电工不会那么容易被替代,有时被归因于Moravec悖论。Steven Pinker在1994年写道,与股市分析和工程师不同,厨师和园丁的工作可以保障几十年不受影响。但我怀疑这个原则甚至在学术界内部也适用:一些工作,如进行实际实验,比制作和运行模型更难自动化。理论工作可能受人工智能的影响更大,而不是更应用、更具体的工作。
注:本博客文章并非由人工智能撰写。请期待拼写错误和语法错误。
丹尼尔·勒米尔,“大型语言模型(例如ChatGPT)作为研究助手”,收录于《丹尼尔·勒米尔的博客》,2024年4月27日。