生成式 AI ChatGPT 会刺激学生在撰写论文时大量作弊的担忧激怒了人们对 AI 伦理和 AI 法的关注

现代学生的作文是不是已经一去不复返了?

充满焦虑的学生学期论文是否正在狂热地飞出窗外?

就是最近闹得沸沸扬扬的骚动。 你看,一款名为 ChatGPT 的 AI 应用程序的出现引起了很多关注,同样也引起了极大的愤怒。 有关我对 ChatGPT 的全面介绍,请参阅 这里的链接. 有关我对 AI 伦理和 AI 法律的持续和广泛报道,请参阅 这里的链接这里的链接,仅举几例。

大喊大叫的要点是这种人工智能,通常被称为 生成式人工智能, 将是要求学生做论文式作业的丧钟。

为什么这样?

因为最新的生成式人工智能只需输入一个简单的提示就能写出看似流畅的文章。 如果你输入诸如“告诉我关于亚伯拉罕·林肯”这样的一行,人工智能将生成一篇关于林肯生平和时代的文章,这篇文章往往足够好,以至于被误认为完全是人类亲手写的。 此外,这才是真正的关键,这篇文章不会是关于同一主题的其他文章的重复或引人注目的副本。 就任何不经意的检查而言,所生成的论文基本上是“原创的”。

面临写作任务的学生只需调用这些生成式 AI 应用程序之一,输入提示,瞧,他们的整篇文章都是为他们写的。 他们只需要将自动生成的文本剪切并粘贴到一个空文档中,偷偷地把他们的名字和班级信息贴在上面,然后带着一点相当勇敢的虚张声势继续把它作为他们自己的作品上交。

老师能够查出这篇文章是由 AI 而不是学生写的机会几乎为零。

丑闻!

头条新闻匆忙宣布我们已经到了让学生写论文或基本上做任何类型的课外写作作业的痛苦结局。 应对这种情况的唯一方法似乎是利用课堂论文写作。 当学生处于教室等受控环境中,并假设他们无法使用笔记本电脑或智能手机时,他们会发现自己仅限于以老式方式撰写论文。

需要澄清的是,老式的方式意味着他们将只能通过使用自己的脑袋来写作。

在课堂外完成的任何类型的论文都会立即受到怀疑。 这篇文章是学生写的还是 AI 应用程序写的? 如前所述,这篇文章将写得非常好,以至于您无法轻易发现它是由机器撰写的。 拼写将是无可挑剔的。 语法将是巨大的。 谈话的路线和潜在的指导论点将是引人注目的。

哎呀,从某种意义上说,你可以建议生成式 AI 会通过撰写一篇超出选择走这条邪恶道路的学生的能力的文章来打破它众所周知的手。 老师可能会因为这篇文章有点太好了而产生怀疑。 一个精明的老师会忍不住猜测学生不可能写出如此优雅和密不透风的散文。 内部警钟开始响起。

当然,对学生的论文提出质疑将是丑陋的,并且会产生不良后果。

假设学生自己认真地写了这篇文章。 他们可能对其进行了双重和三次检查。 也有可能他们让朋友或熟人看看是否有任何需要额外抛光的地方。 总而言之,还是他们写的文章。 想象一下,一位老师向这位认真好学的学生提出有关论文的尖锐问题。 基本上被指控作弊的尴尬和懊恼是显而易见的,即使老师没有大声提出这样的要求。 仅仅是对抗本身就足以削弱学生的自尊心,让他们感到被诬蔑。

有些人坚持认为,任何怀疑文章作者身份的老师都应该要求学生解释他们所写的内容。 据推测,如果这篇文章是由学生写的,那么特定的学生可以充分解释它。 老师们已经进行了亿万年的这种探究。 一个学生可能已经召集另一个学生为他们写论文。 学生可能已经让父母写了他们的论文。 在当今世界,学生可能会花钱请互联网上的人代为秘密撰写论文。

因此,要求学生通过课堂询问来验证作者身份是一种习惯,没什么大不了的。

很高兴你提出来。

试图温和地或明显地盘问学生并不像你想象的那么简单。 学生本可以仔细研究人工智能生成的文章,并为可能的审讯做好准备。

这样想。 学生首先只需按一下按钮即可生成论文。 然后,学生会花费大量时间来写论文,而不是仔细检查和研究论文。 过了一会儿,这些话几乎完全记在了记忆里。 学生几乎自欺欺人地相信他们确实写了这篇文章。 这种表面上的自信和意识很容易让他们通过教师主导的审查。

啊哈,有些人说与生成人工智能应用程序的恐惧有点相反,请注意学生实际上确实通过生成论文“学习”了一些东西。 当然,学生没有跑腿去研究这个话题,他们也没有写论文,但是,如果他们仔细研究了这篇文章,似乎表明他们已经了解了指定的话题。 致力于背诵有关林肯的文章的学生大概已经了解了有关林肯的一些实质内容。

学习已经发生。

哇,反驳说,这项任务可能是一个双重过程。 了解林肯可能相对次要。 真正的目的是让学生学会写作。 作业的这一重要部分已被完全削弱。 老师们经常布置开放式的话题,实际上只是为了让学生体验写作。 你必须列出你想写的内容,你必须弄清楚你将使用的词,你必须将这些词放入一组合理的句子和段落中,等等。 仅仅阅读 AI 生成的论文与论文作业的基础方面完全不相符。

对此的反击是声称学生可能通过仔细检查人工智能产生的写作来学习写作。 难道我们不都研究写作大师,看看他们是如何写作的吗? 我们的写作是为了接触莎士比亚和其他伟大作家。 研究书面文字是获得如何写作的有效手段。

就像一场激烈的网球比赛,球移到了网的另一边。 虽然学习好的写作很好,但如果你想写作,你最终必须写作。 你不能只是无休止地阅读,然后茫然地假设学生现在会写了。 他们必须写,写,一直写,直到他们能够切实展示和提高他们的写作能力。

你明白这是一个怎样的难题吗?

请注意,所有这些都有无数或更多的曲折。

我将介绍一些更巧妙、更有趣的曲折。

通过 AI 提示调整论文

刚才提到了莎士比亚,这里是生成式 AI 的一个方面,您可能会感到惊讶。 在许多生成式人工智能应用程序中,你可以这样说:“写一篇关于林肯的文章,就像莎士比亚写的那样。” 人工智能将尝试生成一篇似乎是用莎士比亚在其作品中惯用的语言写成的文章。 这是一个非常有趣和引人入胜的壮举,许多人从中受益匪浅。

这与使用生成式 AI 写论文“作弊”的学生有什么关系?

在许多生成式 AI 应用程序中,您可以告诉 AI 以不那么出色的方式编写。 人工智能将设法写出一篇边缘有些粗糙的文章。 这里或那里存在语法问题。 文章的逻辑可能会断断续续或略显杂乱无章。

这将是一个聪明的诡计。 学生拿到作文并上交。作文好到可以拿高分,但又不能完美到惹老师生气的地步。 再一次,人工智能为学生完成了所有的跑腿工作,包括让这篇文章有些不完美。

最重要的是,大多数生成式 AI 应用程序都允许您随心所欲地使用该应用程序。 这是如何发挥作用的。 一名学生输入 AI 应用程序是为了写一篇关于林肯的文章,有些不完美。 论文产生了。 学生看着这篇文章,发现它仍然过于完美。 学生输入另一个提示,指示 AI 使缺陷更加明显。

泡沫,冲洗,重复。

学生不断输入提示并检查生成的论文。 这种情况一遍又一遍地发生。 最终,学生让人工智能在文章中达到恰到好处的不完美程度。 金发姑娘版本已经获得。 它完美到足以获得高分,又不完美到足以避免引起怀疑。

我敢肯定你们中的一些人会狡猾地说,如果学生一开始就选择写那该死的论文,他们可能会花更少的时间或至少花同样多的时间来写论文本身。 AI 应用程序的所有这些消耗能量的使用本可以直接用于继续撰写论文。

好吧,请记住,学生并没有想到这一点。 输入提示以及反复检查和选择所需论文的简便性必然会让学生更容易做到。 这样做一个小时比直接写论文要轻松得多。 在这种情况下,必须权衡现实情况。

如果其他学生也这样做会怎样

我敢打赌,当您阅读前面关于论文和生成式 AI 应用程序的分析时,您已经想到了这个聪明的想法,即如果很多其他学生都在做同样的事情,那么这个学生无疑会被抓到。

请允许我解释一下。

一位老师让全班同学写一篇关于林肯的文章。 假设 90% 的学生决定使用生成式 AI 应用程序来完成这项作业。 如果 90% 看起来过于压抑,请继续使用 10%。 请记住,随着学生对生成式 AI 应用程序的实用性有所了解,使用它们的诱惑将会如雨后春笋般涌现。

好吧,班上有相当一部分人使用了生成式 AI 应用程序。 你会假设学生们都将提交大致相同的林肯论文。 当老师给第三篇或第四篇作文打分时,他们会注意到这些作文几乎都是一样的。 这将是一个巨大的线索,表明有什么不对劲。

对不起,但你不太可能那么幸运。

大多数生成式 AI 应用程序对提示的具体组成方式高度敏感。 如果我写“告诉我关于林肯的事”与如果我写“告诉我关于林肯的生活”,很可能这些文章会有本质上的不同。 首先,也许 AI 生成的文章重点介绍了林肯总统在白宫任职期间的情况,而忽略了他童年的任何内容。 另一个提示可能会产生一篇涵盖他出生到死亡的文章。

学生可能不会准确输入老师给他们的作文提示。 作为作弊者,尝试变体似乎是明智的。 但是,即使所有学生都输入了完全相同的提示,每篇文章也很有可能与其他文章有所不同。

这些 AI 应用程序利用了一个庞大的内部制作的数学和计算网络,该网络基本上与互联网上的文本进行了广泛的模式匹配。 生成论文的过程中包含一个概率因素。 所选择的词不太可能具有相同的顺序和相同的确切措辞。 生成的每篇论文通常都会有所不同。

不过有一个问题。 如果选择的主题非常晦涩,则可能会产生一些相似的论文。 这部分是因为文本根部的模式一开始就很薄。 话虽这么说,论文的写作方式可能仍然大不相同。 我要说的是,内容本身的本质可能大致相同。

不想显得闷闷不乐,但您可能会对像林肯的生平这样的共同话题做出同样的声明。 您可以用多少种不同的方式详细说明他生活的各个方面? 如果你以某种方式让学生在一个锁着的教室里写关于林肯的文章,并让他们在线访问以研究他的生活,我敢说这些文章有些相似的可能性无论如何都会发生。

洒脱的因素很重要

如果现在的学生想通过在 Internet 上付钱给别人写论文来作弊,这样做非常简单(我希望这不会让您感到震惊,也许我应该事先提供触发警告)。

但问题是您确实需要为论文付费。 此外,您以后可能会被抓住的可能性很小。 你用信用卡支付论文费用吗? 也许最好使用某种形式的地下支付处理来尝试保持你的踪迹清晰。

生成式 AI 的美妙之处或者也许是令人恼火的因素在于,现在大多数都是免费提供的。 无需付款。 没有关于您使用情况的特定跟踪记录(好吧,需要明确的是,AI 应用程序可能会跟踪您的使用情况,尤其是因为许多 AI 应用程序要求您使用电子邮件地址注册,当然,您也可以伪造该地址).

有些人自然而然地认为您需要成为 AI 向导才能使用生成式 AI 应用程序。

但事实并非如此。

总的来说,生成式 AI 应用程序使用起来非常简单。 您调用 AI 应用程序。 它会向您显示一个打开的文本框,供您输入提示。 您输入提示并点击提交。 AI 应用程序生成文本。

就是这样

不需要专门的计算机语言。 不了解数据库或数据科学。 我向您保证,几乎所有学校的孩子都可以轻松使用生成式 AI 应用程序。 如果孩子可以打字,他们就可以使用这些应用程序。

一些人认为,提供生成人工智能应用程序的公司应该首先验证用户的年龄,大概是为了防止非成年人在写作时使用人工智能作弊。 如果用户表示他们不是成年人,请不要让他们使用 AI 应用程序。 坦率地说,这是不太可能的预防方案,除非以某种方式颁布了与人工智能相关的法律,试图建立此类限制。 即使通过了此类法律,您也可以通过使用在另一个国家等托管的生成式 AI 应用程序来解决这个问题。

另一个令人望而却步的角度是生成式人工智能应用程序是否需要花钱才能使用。 假设有每笔交易费用或订阅费。 这将使生成式 AI 应用程序与互联网上的那些人相提并论,这些人会为你写一篇文章,要求你这样做。 工党将与人工智能正面交锋(顺便说一句,这一切确实表明,以为学生写论文为生的人类将被做同样事情的人工智能所取代;问题是我们应该感到悲伤还是高兴那些以这种方式谋生的人将不再能够以这种方式这样做)。

开发生成式 AI 应用程序的公司当然希望从这些应用程序中赚钱,尽管如何做到这一点仍然悬而未决。 收取交易费、订阅费,或者可能按生成的字数收费,这些都在讨论中。 与其向人们收费,不如通过使用广告来实现货币化。 也许每次您使用特定的生成式 AI 应用程序时,您首先必须看到一个广告。 那可能是一个赚钱的人。

我不想在这上面泼牛奶,但作为克服学生作弊的一种手段,它不会成为任何灵丹妙药。 差远了。

生成人工智能有开源版本。 人们把它们放在那里,其他人则倾向于免费提供该应用程序。 不管怎样,即使某些公司收取费用,您也可以找到免费使用的变体,尽管您可能需要查看广告或可能需要注册并出于营销目的提供一些有关您自己的信息。

多步骤有帮助吗

一名学生选择使用生成式 AI 应用程序来撰写论文。

学生决定编辑论文,而不是直接上交论文。 他们明智地在这里说了几句话。 在那里说几句。 上移一句话。 再往下移动一个句子。 经过一些编辑和提炼,他们现在有了一篇准备上交的论文。

这篇文章是学生的作品还是不是?

我已将您带到了价值数百万美元的重大未解之谜。

让我们做一些关于合法权利和侵权的快速背景知识。 这是一个我已经涵盖了很多的主题,例如 这里的链接这里的链接,例如。

您可能已经对版权和所谓的知识产权 (IP) 有所了解。 拥有受版权保护的故事的人应该保留与该故事相关的各种合法权利。 他们没有完全铁定无所不包的合法权利。 有例外和例外。

侵犯某人受版权保护的材料的最棘手的问题之一是与原始来源相比您可能拥有的内容的接近程度。 也许您已经阅读或看过有关著名歌手及其歌词的新闻报道,据此,有人用看似相似的歌词写了一首歌,无论这是否合法。

我之前提到过,通常情况下,生成式 AI 应用程序不会生成一篇文章,该文章是其他材料的副本,而这些材料是早期通过检查 Internet 上的内容进行训练的。 有可能材料被概括并且全部模糊在一起,以至于它不再与源内容所包含的任何内容非常相似。

我们将不得不等待,看看法律程序如何处理这个问题。 如果生成式 AI 应用程序生成的艺术品在视觉上明显类似于某些来源的艺术品,我们可能会倾向于指责 AI 和 AI 的制造者侵犯了与原始作品相关的版权。 我们可以亲眼看到。

对于论文,这可能会更棘手。 最明显的例子是整个句子和段落逐字相同。 我们都可以看到这一点。 但是当措辞略有不同时,我们就会进入灰色地带。

新制作的材料必须与原始材料相差多远才能根据其自身的优点宣布它是真正的原始材料?

这是一个沉重的问题。

让我们将其与使用生成式 AI 应用程序撰写论文的学生联系起来。

假设人工智能应用程序生成的一篇特定文章将被解释为一篇“原创”文章。 我的意思是假设它不会以任何明显的方式违反地球上任何地方任何其他先前存在的文章或文本叙述。

然后学生从材料的原始来源开始。 如前所述,学生编辑并完善了该材料。 事情到了一个地步,即 AI 应用程序生成的原始版本现在与学生设计的改进版本不同。

这是作弊吗?

可能是,可能不是。

你可以说它是。 学生开始让 AI 为他们写论文。 学生所做的一切都是机械地玩弄这篇文章。 我们希望学生凭空写出论文,并利用自己的头脑来完成。 使用 AI 应用程序生成基线显然是作弊。 给学生打“F”级。

没那么快。 你可以说这不是作弊。 学生重新制作了源材料。 如果 AI 应用程序生成的论文和学生修改后的版本之间的比较差异足够大,我们会说学生写了这篇论文。 不可否认,他们在这样做时使用了其他材料,但如果他们使用百科全书或其他来源,你不能说同样吗? 这名学生通过自己的智慧撰写了一篇论文(尽管参考了其他材料),应该得到“A”级。

教师们将陷入这个已经令人烦恼的问题之中。

一种方法是,教师可能会明确指出学生必须列出所有参考资料,包括是否使用了生成式 AI 应用程序。 如果学生没有直接列出生成式 AI 作为参考,而老师发现他们没有列出,则该学生的作业将立即获得“F”等级。 或者,也许有些学校会认为这是一种导致学生自动不及格的作弊行为。 或者可能被开除。 我们必须看看学校在这些问题上能走多远。

总的来说,我们正在走向一个知识产权和作品合法所有权的颠倒世界,例如论文(文本)、艺术(图像)和视频,包括:

  • 一些人会向生成式 AI 制造商寻求法律补救,以解决 AI 用于生成所产生输出的内容来源。
  • 有些人会将生成式人工智能的输出视为自己的作品,然后试图向任何侵犯其“原创”作品的人寻求法律补救。
  • 这可能会循环,例如有人从生成式 AI 中生成输出,这些输出发布在互联网上,然后其他一些生成式 AI 出现并在其生产类似作品的培训中使用它。

化消极为积极

所有这些关于生成式人工智能在学生作弊方面的坏处的讨论可能正在蒙蔽我们的思想,一些劝告。

换个方向。

你坐下吗

也许教师应该有目的地考虑让学生使用生成式人工智能作为学习如何撰写论文的过程的一部分。

我以前写过关于所谓的 双重用途 人工智能,见 这里的链接. 这个概念是,有时 AI 系统可以用于坏事,有时可以转换并用于好事。 令人担忧的是,当有人为了好的目的而编写 AI 时,却幸福地没有意识到他们的 AI 是多么容易变成坏事的幽灵。 部分 道德AI 是意识到人工智能应该被设计成不能在一夜之间变成诅咒。 这是一个持续的问题。

回到用于撰写论文的生成式 AI。

我早些时候提出了这样一个概念,即学生可以通过查看已经存在的书面作品来学习写作。 这很有道理。 基本上,您阅读的内容越多,您就越有可能将您的精神表象扩展到能够写作。 如前所述,您仍然需要写作,因为如果您不练习写作,那么世界上所有的阅读都不一定能让您成为一名优秀的作家。

我们可以使用生成式 AI 来促进这种读写耦合。 让学生有意使用生成式 AI。 人工智能产生了一篇文章。 给学生的任务是评论 AI 生成的论文。 接下来,学生被分配写一篇新文章,主题可能不同,但可以使用早期 AI 生成的文章的结构和其他一般元素。

一些人认为,对于学生来说,这可能比简单地阅读学生无法与之“互动”的作家的书籍或其他文本更有成效。 借助 AI 应用程序,学生可以尝试使用大量提示一个接一个地重新运行并生成初始论文。 学生可能会告诉 AI 写一篇关于林肯的准系统文章。 接下来,学生要求以非正式的语气写一篇关于林肯的长篇论文。 看完之后,学生指示 AI 应用程序生成林肯论文的高度形式化版本。 等等。

所做的断言是,这可以在物质上帮助学生学习写作以及如何进行写作。

最近的一篇研究论文提出了这一点:“本文的作者认为人工智能可以用来克服课堂学习的三个障碍:改善迁移、打破解释深度的错觉以及训练学生批判性地评估解释”(在题为“人工智能聊天机器人启用的新学习模式:三种方法和作业”的论文中,Ethan Mollick 博士和 Lilach Mollick 博士, 宾夕法尼亚大学沃顿商学院和沃顿互动,12年2022月XNUMX日)

例如,他们指出,改善学习迁移可能会以这种方式发生:“人工智能是一种廉价的方式,可以为学生提供许多示例,其中一些示例可能不准确,或者需要进一步解释,或者可能只是编造的。 对于具有某个主题基础知识的学生,您可以使用 AI 来帮助他们测试他们的理解,并明确地促使他们说出并解释某个主题的不准确、差距和缺失的方面。 AI 可以提供一系列无穷无尽的概念示例和这些概念的应用,您可以促使学生:比较不同背景下的示例,解释概念的核心,并指出 AI 应用概念的方式中的不一致和缺失信息新情况”(同上)。

这类似于老话,如果你不能打败他们,就加入他们。

将生成式 AI 变成一种教育工具。

哎呀,快速响应。

你把狐狸放进了鸡舍。 不知道什么是生成式人工智能的学生现在将通过老师和学校的公开行动公开展示它。 如果学生对作弊的机会一无所知,那么您就是将其直接放在他们的脸上和手中。

那些当权者向学生介绍作弊手段似乎是完全令人反感的。 因此,您将永远把最诚实的学生置于作弊诱惑的境界。 每个人都可以使用作弊机器。 他们被告知要这样做。 无需隐藏它。 无需假装您没有使用生成式 AI。 学校和老师让你用的。

对此的反驳是,你必须盲目和无知地把头埋在沙子里,以为学生不会熟悉生成人工智能。 当您愚蠢地假装他们不知道时,他们正匆匆走出学校去使用它。 你更好的选择是向他们介绍这个东西,讨论它能做什么和不能做什么,并为整个难题带来明亮的光芒。

这真是个傻瓜。

对于那些正在研究技术教育创新的人,您可能想看看生成式 AI 以及它如何改变教育方法的性质并影响学生的学习。 它很快就会到来。

使用检测将我们从毁灭中拯救出来

换个角度,让我们暂时考虑一下数字艺术作品。

如果您创作了一件数字艺术作品,您可能希望以某种方式对其进行标记,以便日后辨别是否有人选择使用或重复使用您的艺术作品。 一种简单的方法是更改​​数字作品中的一些像素或点。 如果你在这里或那里做一些,艺术品的外观在人眼中看起来仍然是一样的。 他们不会注意到那些很小的像素,它们被设置为某种特殊颜色,只有通过数字工具仔细检查才能看到。

您可能知道这些技术是一种水印形式。 就像过去尝试给纸质材料和其他非数字化内容加水印一样,我们也逐渐看到了数字水印的兴起。

数字水印可能隐藏在数字艺术作品的图像中。 如果这看起来对图像有干扰,您可以尝试将水印嵌入到包含数字作品的文件中(数字作品的所谓“元数据”)。

可能会出现猫捉老鼠的游戏。

一些坏人出现了,他们发现了您的数字水印。 他们将其删除。 现在,他们似乎可以自由地使用您的数字艺术作品,而不必担心您稍后会发现它并清楚地表明它是对您的努力的剽窃。 那些恶棍!

我们需要加强数字水印,我们可以通过使用密码技术和技术来做到这一点。 想想秘密消息和编码。

这个想法是我们对数字水印进行编码,以便很难找到它。 它也可能难以移除。 我们甚至可以尝试确保将显示或允许使用数字艺术品的软件必须首先检查并查看作品中是否存在有效的编码数字水印,否则将被视为不正确的副本。 当场抓住你。

我们可以对生成文本的生成 AI 做同样的事情吗?

一个挑战已经放下。 不过,这个问题在某种程度上可能比考虑艺术品的数字水印时更棘手。

这就是为什么

假设您唯一可以放置水印的地方是直接放入文本本身。 我这样说是因为生成的文本不一定会进入文件。 文字只是文字。 您可以从生成式 AI 工具中剪切和粘贴它。 从这个意义上说,通常没有可以嵌入水印的元数据或文件。

你必须只关注文本。 纯文字。

一种方法是偷偷让生成式 AI 以可追踪的方式生成文本。 作为一个粗略但不切实际的例子,想象一下我们决定在每三个句子的开头以单词“And”开头。 我们仍然会生成一篇看似完全流利的文章。 唯一的诡计是每三个句子都以我们选择的魔法词开头。 没有其他人知道我们在做什么。

一名学生使用生成式 AI 来制作有关林肯的指定论文。 学生直接从 AI 应用程序中获取并通过电子邮件发送给老师。 事实证明,学生一直等到最后一刻才赶上公布的截止日期。 没时间复习论文。 只需发送它并希望最好。

老师看着作文。 假设我们已经告诉她,我们的水印由每三个句子开头使用的神奇单词组成。 老师检测到这篇提交的论文就是这种情况。 尽管学生写这篇文章的可能性非常小,并且可能喜欢在每三个句子的开头使用这个特定的词,但我认为我们可以合理地同意这是极不可能的,相反学生可能使用了生成 AI来制作论文。

你看到它是如何工作的吗?

我相信你会的。

现在的问题是如何想出一个不太明显的水印。 学生可能会注意到这些句子似乎奇怪地使用了一个特定的词。 他们可能会猜到发生了什么。 反过来,学生可能会移动句子并进行一些改写。 这几乎会降低这个特殊的水印,因为这篇文章不再容易被识别为由生成 AI 撰写。

猫捉老鼠的游戏再次向前推进。

我们需要生成流畅的文本,以某种方式以不易辨别的方式包含“水印”。 此外,如果可能的话,即使文章略有修改,水印也应该继续存在。 全面修订可能不会让水印保留下来。 但是我们需要一些冗余和弹性,以便即使对文本区域进行了一定程度的更改,水印也能被检测到。

一位正在为制作 ChatGPT(OpenAI 的 AI 应用程序)的公司做一些工作的研究人员正在根据这些水印注意事项探索一些有趣的密码学工作。 Scott Aaronson 是德克萨斯大学奥斯汀分校的计算机科学教授,他最近就正在进行的一些工作发表了演讲(他的博客上发布了一份文字记录)。

考虑一下他简要解释现有方法的这段摘录:“它是如何工作的? 对于GPT,每一个输入和输出都是一串token,可以是单词,也可以是标点符号,单词的一部分,或者更多——总共大约有100,000个token。 GPT 的核心是不断生成下一个要生成的 token 的概率分布,以先前 token 的字符串为条件。 在神经网络生成分布后,OpenAI 服务器实际上会根据该分布或分布的某些修改版本对令牌进行采样,具体取决于称为“温度”的参数。 但是,只要温度不为零,下一个标记的选择通常会有一些随机性:您可以使用相同的提示一遍又一遍地运行,并且每次都得到不同的完成(即输出标记字符串) ”

如前所述,关于将哪些单词放在由 ChatGPT 应用程序生成的文章中,有一定的随机性。 这也解释了之前的观点,即即使是同一主题,每篇文章也可能有所不同。 在论文生成过程中,有目的地使用特定范围内的随机选择方法正在运行。

我们现在进入有趣的部分,密码混合:“那么要加水印,不是随机选择下一个标记,而是伪随机选择它,使用密码伪随机函数,其密钥只有 OpenAI 知道. 假设最终用户无法区分伪随机数和真正的随机数,这不会对最终用户产生任何可察觉的差异。 但是现在你可以选择一个伪随机函数来秘密地偏置某个分数——在每个 n-gram(n 个连续标记的序列)上评估的某个函数 g 的总和,对于一些小的 n——如果你知道,你也可以计算哪个分数这个伪随机函数的关键。”

我意识到这在技术上似乎有点拥挤。

实质是生成的文章看起来很流畅,您将无法通过阅读文章轻松辨别它是否包含数字水印。 要弄清楚给定的文章是否确实包含水印,您需要将文章输入专门设计的检测器。 执行检测的程序将根据文本计算一个值,并能够将其与存储的密钥进行比较。 在所描述的方法中,密钥将由供应商持有并且无法以其他方式获得,因此,假设密钥是保密的,在这种情况下,只有指定的检测程序才能计算出这篇文章是否可能来自 ChatGPT。

他继续承认这并非万无一失:“现在,只要付出足够的努力,这一切都可以被打败。 例如,如果您使用另一个 AI 来解释 GPT 的输出——好吧,我们将无法检测到它。 另一方面,如果你只是在这里或那里插入或删除几个单词,或者重新排列一些句子的顺序,水印信号仍然存在。 因为它只依赖于 n-gram 的总和,所以它对这些类型的干预很稳健。”

一位教师可能被授予访问检测程序的权限,该程序将检查学生的论文。 假设事情相对容易,因为老师让学生将他们的论文通过电子邮件发送给老师和自动检测器。 在这种情况下,检测器应用程序会通知老师这篇文章由 ChatGPT 撰写的可能性。

现在,如果检测器对任何人开放,你就会有“成绩优异”的学生作弊者,他们会简单地将他们的论文输入检测器并进行一系列更改,直到检测器表明该论文是由生成器派生的可能性很低人工智能。 更多的猫捉老鼠。 据推测,检测器必须通过使用密码进行严格保护,或者需要一些其他处理加密方法的手段或方法(可以使用多种基于密钥和无密钥的方法)。

教师可能面临着数十或数百个生成的 AI 应用程序可在 Internet 上使用的可能性。 在这种情况下,试图让所有这些人都使用一些数字水印,并且必须向所有这些人提供一篇文章,好吧,它只会变得更加迷人和逻辑复杂。

课堂外不再有论文

一个悲观的观点是,也许教师将不得不放弃使用外部论文写作。 所有论文必须仅在教室的受控环境中撰写。

这有很多很多问题。

假设一个学生通常需要十个小时来写一篇特定的完整论文,这是一个课堂项目。 这将如何在教室里完成? 你打算把它打包,让学生在几天内写一小段文章吗? 想想这带来的困难。

有人声称这件事可能被夸大了。

教师应该像往常一样对待学生的剽窃行为。 老师预先声明剽窃是一个严重的作弊问题。 强调以任何方式使用生成式 AI 都将被视为作弊行为。

做出具有重大意义的处罚,例如低分、不及格课程或开除学校。 要求学生为每项外部论文作业以书面形式证明他们上交的是他们的工作(在没有生成人工智能等辅助工具的情况下完成,从互联网上复制,使用同学,使用父母,支付完成它,以及很快)。 此外,要求学生列出在准备工作时使用的所有在线工具,包括特别要特别注意任何生成 AI 的使用。

老师可能会也可能不会使用检测器应用程序来尝试辨别提交的文章是否可能是由生成式 AI 应用程序生成的。 这可能是一个繁重的步骤,具体取决于检测器使用和访问的难易程度。

教师们大概应该已经在采取行动查明外部书面论文是否合法。 通过在课堂上写作文,有机会进行比较和对比,但意识到在课堂上写作的时间更少,而且也可能受到不允许访问在线参考资料的限制。

要点是我们不应该采取突然放弃使用外部论文写作的方式。 有些人会谴责这是一种轻率的行为,这似乎让人想起把婴儿连同洗澡水一起倒掉(一句老话,也许值得退休)。

如果完全停止将课外写作作为一项学习活动,那么将这种看似日常的教育活动从课程中移除可能会带来严重且长期的不利影响。 这涉及到权衡。 尽管有上述所有制衡措施,但有多少学生会作弊? 有多少学生不会作弊,因此会继续使用有益的教育方法来提高他们的写作能力?

从理论上讲,希望作弊者的比例足够小,使得课外写作仍然对占优势的学生有利。

结论

人工智能可能非常令人头疼。

对于教师来说,人工智能既是福也是祸。 无论哪种方式,这都意味着教师需要了解人工智能,以及如何应对与教学活动相关的人工智能曲折,这又给他们已经过度伸展的背部和肩膀增加了负担。 向各地的老师致敬。

也许我们可以希望人工智能消失。

NOPE。

你看,我们不会让时光倒流并淘汰生成式人工智能。 任何呼吁这样做的人都是梦想家。 而且,顺便说一句,我使用“和”这个词作为本段第三句话的第一个词(哎呀,放弃了钥匙!),生成式人工智能将继续存在。

这是让您进行激烈讨论的提示: 生成式人工智能将变得更加普遍,并具有更加惊人和令人不安的能力。

麦克风下降。

现在的最后想法。

莎士比亚有句名言:“生存还是毁灭:这就是问题所在。”

我向你保证,生成式人工智能将会成为现实。 已经是了。

我们必须弄清楚我们希望生成式人工智能如何进入我们的生活,以及社会将如何选择塑造和引导这种使用。 如果你需要一个思考 AI 伦理和 AI 法律的理由,也许生成 AI 会促使你去寻求了解我们是什么,即使我们不知道我们可能是什么(隐藏的莎士比亚参考)。

来源:https://www.forbes.com/sites/lanceeliot/2022/12/18/enraged-worries-that-generative-ai-chatgpt-spurs-students-to-vastly-cheat-when-writing-essays- spawns-spellbound-attention-for-ai-ethics-and-ai-law/