如何判断文章是否为ChatGPT所写?

时间:2023年08月08日

/

来源:网络

/

编辑:佚名

生成式预训练模型(GPT)等自然语言处理(NLP)技术以其创作出与人类文字难以区分的能力让全世界为之惊叹,同时也引发了人们对其可能被滥用的担忧。这些模型在写作领域有着广泛的应用,但是如果学生使用这些工具来完成作业,往往会对他们的学习过程产生负面影响。

如何判断文章是否为ChatGPT所写
当大量机器写的内容出现时,我们开始探索各种方法,如何通过人工或者自动化的方式来鉴定一篇文章是否是由AI生成的。本文狂人SEO为大家详细介绍如何判断一篇文章是不是ChatGPT写的?
一、适当借助工具进行创作
新的自然语言处理模型,如ChatGPT、Claude等,正在深度改变我们的写作方式。凭借这种强大的技术,我们能够快速地将思考或一系列要点转化为文章。这些AI模型能够根据你的需求提供很多的建议和新颖的思维,帮助我们摆脱创作中的瓶颈。无论是有经验的作者,还是刚入门的新手,都可以借助新一代的NLP模型进行写作。
然而,把这些AI模型当作写作工具也有不足之处。例如,在中等或高等教育阶段,写作训练的目标是教会学生如何写好一篇文章,以及如何提出和阐述有说服力的观点。写作还是一种让学生学习如何查找支持文章观点的证据,以及锻炼他们批判性思维技能的工具。如果完全依赖AI模型来完成这些任务,学生就会错过这个重要的学习过程,无法掌握这些关键技能。因此,当前的研究趋势是探究如何准确判断一篇文章是否由AI编写。
二、发掘迹象:如何识别AI创作
随着AI智能写作技术的普及,我们有机会深入了解AI创作的各种类型,这也帮助我们更好地鉴别一篇作品是人类创作还是机器生成。有趣的是,这种鉴别通常更多地依赖于文章的整体流畅度,而非语法和拼写的细节。但是,对于那些经常引用确定答案或者大家都关注的热点话题,即使是人类创作的内容也可能看起来与AI生成的内容雷同。尤其是对于较短的文章,无论从视觉还是听觉上都难以分辨。因此,只有在文章足够长时,我们才可能有效地识别出它是否由AI生成。
AI写作的一大特点是会重复一些内容,特别是在撰写长篇文章时。像ChatGPT这样的模型在预测下一个词汇时,会基于之前的所有预测结果;因此,在一系列预测文本中,越早出现的词汇,重复出现的可能性就越大。
另一个显著的AI写作特征是缺乏感情色彩,内容平淡,没有强烈的情感或观点。对于那些熟悉作者风格的读者,尤其是老师和学生,很容易就能识别出这一点。如果有同一作者的其他作品作为参照,就更容易识别出AI文本。如果两篇文章的常用表达方式和语言风格有很大差异,那么很可能这两篇文章并非出自同一人之手。
还有一个特征是对事实的正确表述和引用是否准确。众所周知,像ChatGPT这样的生成模型有时很难给出正确的答案(尽管它们可能会很自信地断言),因为即使这些模型接受了大量的互联网文本训练,但它们实际上并不能记住所有的内容。这些模型所做的,基于对事物的大致理解,以类似人类的方式展示所学的知识,而不是复制一些琐碎的细节。
对于许多无法验证真实性的内容,如果有一定研究的人会发现存在的错误,也能很好地证明这篇文章是由AI生成的,尤其是在内容与时事、人物或地点有关时,这是因为最新版本的公开模型只在某个日期(如当前ChatGPT是2021年9月之前)的数据上进行了训练。不过,在评估这一特定迹象时,需要检查这一模型是否更新了知识库的日期。

检测内容是AI机器所写
三、通过AI内容检测工具
随着人工智能的复杂度不断增加,有些AI生成的内容很难被人类识别,有时甚至会被误认为是人工创作的。为了解决这个问题,人们已经开发出了一些新的AI检测工具,专门用来检测书面内容是否是由AI生成的。例如,有些新型的大型语言模型正在接受训练,它们可以知道何时向外部资源发送请求,以获取信息或进行数学计算。这就消除了我们难以判断一篇作品是否由AI创作的困境。
为了解决这个问题,许多大公司甚至推出了一系列AI模型,这些模型可以确定内容的来源。OpenAI,也就是我们ChatGPT的开发者,也发布了一个工具(platform.openai.com/ai-text-classifier),帮助教育工作者鉴别一篇文章是否由大型语言模型创作。通过一系列的测试,我们发现这个工具能够识别出26%的AI生成的文本,但也存在9%的误报率,可能会错误地将人类创作的文本标记为AI生成的文本。尽管这个工具还存在一些问题,但OpenAI仍然希望这个不完美的工具能够帮助打击那些利用AI进行学术不端行为的情况。
另一个可以提高AI文本检测成功率的方法是使用多个第三方平台开发的工具。GPTZero和Originality等AI内容检测工具可以通过检测文本的突发性和困惑度来判断文本是否由AI生成。这两个指标分别衡量机器预测下一个文本的可能性和句子中困惑度的变化,其中,人类创作的文本具有更高的随机性,而AI生成的文本更倾向于保持困惑度的稳定。然而,这些AI工具也存在一些局限性,例如,DetectGPT只适用于某些GPT模型,因此,将几种分类器的结果组合起来可能会更有效地识别出AI生成的文本。
猜你需要

豫ICP备2021026617号-1  豫公网安备:41172602000185   Copyright © 2021-2028 www.78moban.com/ All Rights Reserved

本站作品均来自互联网,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如有侵犯您的版权,请联系 1565229909#qq.com(把#改成@),我们将立即处理。