GPTZero: 如何检测ChatGPT抄袭 | Digital Trends

2024 年 5 月 17 日

关于改变世界的技术，ChatGPT 在短时间内真正改变了人们对写作和编码的看法。对许多不自信自己写作技能或希望节省时间的人来说，插入提示并得到一串几乎足够好的文本是一个诱人的选择。然而，这种能力也带来了显著的副作用，特别是在教育领域，学生们被诱惑使用 ChatGPT 写论文或考试，这阻止了他们学到更多东西，也给老师们带来了新的困扰，尤其是在检测 AI 使用方面。

内容

什么是 GPTZero？
GPTZero 是免费的吗？
GPTZero 准确吗？
GPTZero 如何工作？
我怎样使用 GPTZero？
为什么我的文章被标记为 AI？
我们真的需要检查抄袭吗？

老师和其他用户现在正在寻找方法来检测学生作品中是否使用了 ChatGPT，许多人转向工具如 GPTZero，这是由普林斯顿大学学生 Edward Tian 开发的 ChatGPT 检测工具。这个软件对每个人都是开放的，所以如果你想尝试一下，看看特定文本是使用 ChatGPT 写的几率，以下是如何操作的。

什么是 GPTZero？ #

GPTZero 是一个旨在检测一段文本是由人类还是人工智能编写的网络应用程序和服务。22 岁的普林斯顿大学计算机科学本科生、微软前软件工程实习生 Tian 是 GPTZero 的开发者。

GPTZero 是由 Tian 在 2023 年 1 月 2 日的推文中首次宣布的，作为一个帮助检测 AI 抄袭的工具。Tian 指出，这项分析基于普林斯顿大学博士候选人 Sreejan Kumar 的研究以及普林斯顿自然语言处理小组的工作。

GPTZero 是免费的吗？ #

GPTZero 是为教育工作者设计的，但任何人都可以免费使用。服务条款中提到一些服务可能会收费。对于新注册用户，还提到了一个为期 30 天的免费试用期。

GPTZero 不是一个开源项目，如果没有 Streamlit 的帮助，Tian 将面临高额的主机费用。虽然 GPTZero 的流量只是 ChatGPT 的一小部分，但即使 OpenAI 也决定开始收费以抵消其成本。

GPTZero 准确吗？ #

有人声称 GPTZero 可以被欺骗。根据 Reddit 用户 Smellz_Of_Elderberry 的建议，我让 ChatGPT 写了一篇关于《老人与海》的简短故事，假装是一名高中学生。GPTZero 没有受骗。

我试着再次改变文本，加入了一些错位的标点、错误的动词时态和其他小错误，但 GPTZero 仍然表示“你的文本很可能完全是由 AI 写的”。

GPTZero 如何工作？ #

GPTZero 分析文本的随机性，即被称为困惑度的统计数据，以及文本内部这种随机性的均匀性，称为突发性。人工智能在困惑度和突发性上非常一致，而人类作家在没有任何意识的情况下会改变这些特征。

Tian 指出，还有更多测试将被添加以提高 AI 文本检测的准确性。特别是，隐性偏见是另一种探测文本是否由 AI 生成的方法。

我怎样使用 GPTZero？ #

GPTZero 可在其网站或通过应用程序编程接口（API）上使用。要使用网站，只需复制您要检查的文本，并粘贴到标有“尝试一下”的大框中。

上传 PDF、Word 文档或文本文件，然后点击“获取结果”按钮。您还需要勾选确认框。为什么我的写作会被标记为AI？

随着ChatGPT的兴起和AI检测工具的普及，现在作家和读者都担心如何区分内容是否由AI创建以及是否真实的写作被标记为AI。这对学生来说是一个特别的问题，如果被发现使用AI，他们可能会面临学校或大学的后果。一些学生现在习惯性地将自己的原创作品通过GPTZero等检测器，发现即使他们的作品并非如此，也被标记为AI写作。

2024年，《大西洋》的作家伊恩·博戈斯（Ian Bogost）描述了他通过检测软件检测自己的原创作品 (opens new window)，最初发现有惊人的74%的作品被标记为抄袭。通过仔细检查和排除，他设法将这个数字降至零，但他花了几个小时进行审查和设置调整才做到这一点。

AI检测类似于检测剽窃，因为两者都只能反映关于一篇写作是原创还是人类创作的最佳猜测。这些工具都需要进行大量的仔细审查，因为两者都可能产生误报 (opens new window)。如果你发现你的工作被标记为AI在GPTZero上生成的，而实际上并非如此，可能的原因包括非英语为母语、想法过于重复或使用了类似Grammarly的工具。

如果你的工作被标记为AI，务必仔细检查你的引用和引文格式，避免使用类似Grammarly的自动工具进行编辑。

我们真的需要检查剽窃吗？

超越许多文本生成人工智能一直局限于的研究实验室，OpenAI于2022年11月底向公众发布了ChatGPT (opens new window)。到2023年1月，ChatGPT已拥有超过1亿用户，成为迄今增长最快的公共应用程序。

这意味着随着这种AI辅助在生活的各个角落都可用，对剽窃的任何担忧都只会增加。微软正在将OpenAI的技术 (opens new window)整合到必应搜索中，而谷歌正在测试自己的版本，称为Gemini（之前称为Bard） (opens new window)。

AI图像生成器如Dall-E和Stable Diffusion正受到潜在侵犯版权的审查。所有这些人工智能服务都是在在线找到的写作、照片和艺术品的基础上进行训练的，这些作品是由数十亿人类创作的。

在某种程度上，AI是借鉴于人类智慧，而不是独立创作。如果我从另一个人那里借用，我必须给予信用并可能支付授权费。对于生成式AI，要引用来源就变得更加困难，因为每个文本或图像都被分解为不同的元素，然后重新组合以使用成千上万甚至数百万的来源创作新作品。

我们要么重新思考我们对版权和剽窃的看法，要么找到能帮助识别AI生成物的工具，并可能开发一种方法来向为每个AI生成作品作出贡献的众多人员给予功劳。