Meta AI 推出注入 AI 的外交魅力，将 AI 伦理和 AI 法律搅入不雅的争端

我们能否让人工智能赋予与人类同等的外交能力？人工智能开发人员的目标是这样做。

盖蒂

受人尊敬的魅力和外交世界常常被粗鲁和无礼所玷污。

伟大的幽默家和社会评论员威尔·罗杰斯 (Will Rogers) 有句名言，外交就是说“好狗”的艺术，直到你找到一块石头。

明显的暗示是，有时您必须坚决阻止任何迫在眉睫和危险的力量，直到您找到合适的防御解决方案。在绝境时做你需要做的事。故意和有目的地安抚那些危害你的人，用你抚慰和迷人的话语，争取宝贵的时间来武装自己更实际和明显的有形立场。

广告投放

一些人断言，战争不可避免地是外交失败的结果。从这个深思熟虑的观点来看，持续不断的外交鼓动将避免战争。继续说话，战斗就不会开始了。其他人则强烈反对这种有问题的观点。也许，据说，外交实际上是让我们卷入战争的原因。最重要的是，外交可能会延长战争并使战斗无休止地进行。

我们将再给威尔·罗杰斯一次机会，从外交对战争的发生或持续的影响是好是坏的问题中体会一些幽默：“把外交从战争中拿出来，事情会在一周内平息”（他据报道）。

外交的共同定义强调国家之间的关系。外交官代表特定的国家或民族国家，在履行其神圣职责时行使外交。我们希望我们的外交官能够沉着冷静地传达他们的外交政策。信使不应该是引发敌意的人，而只是信息可能会引发敌意。即使是最令人震惊的信息，大概完美无瑕的外交描述也能明显减轻原本有害的要求或威胁所带来的打击。

广告投放

当然，外交并不仅限于正式外交官的崇高工作。我敢说，在我们的日常生活中，我们都不得不接受一些外交的表象。如果您希望朋友在您出差时照看您心爱的狗，您肯定会委婉地提出照顾这只狗的请求。直接提出这样做的要求很可能会以沉闷的砰砰声落地。

也许与其说是科学，不如说是一门艺术，外交是人类用来润滑滑板、保持照明和防止社会完全失控的东西。谈判开始发挥作用。绥靖政策可能需要出现。有时你使用胡萝卜，有时你使用大棒。如果你必须这样做，你可能会尝试所谓的炮舰外交，你试图恐吓你周围的人。或者，您可以走温和的调解和人道主义路线，而不是强力武装。这一切都取决于。

好的，所以我们很容易同意外交是一种重要的人与人之间的交流方式。它包括与运用机智、调解、谈判、调解和一系列社会巧妙的政治活动相关的实践或舞台技巧。

广告投放

让我们在该等式中添加其他内容。

你准备好了吗？

我们将添加您可能尚未考虑过的其他内容。

人工智能（AI）。

是的，人工智能正在进入外交策略。这似乎是完全明智的。如果我们要让 AI 融入我们生活的方方面面，最终必须轮到外交。我们可能期望人工智能能够通过使用适当的外交措辞和礼仪来履行它的任何职责。

广告投放

人工智能作为自主或半自主的外交官。

我意识到这可能看起来相当令人生畏和完全可怕。我认为我们中的任何人都没有准备好让人工智能作为我们各自国家的代表四处走动。想象一下 AI 代表我们谈判我们的国际立场并确认我们的全球政治姿态。哎呀！这是那些世界末日科幻故事的素材。

好吧，暂时松一口气，因为现在还不可能。

相反，想想你用来完成银行业务或帮助指导你买房的人工智能。今天与人互动的人工智能通常非常简单。只看事实，只看事实。一些 AI 已经用可爱的措辞蒙上了一层阴影，让你认为它是友好的或伙伴，尽管这很快就会被识破。仅仅因为人工智能系统用你的名字来称呼你，或者发出像“你好”而不是“你好”这样的词，我们大多数人马上意识到这是一个字谜游戏。

AI 开发人员热切追求的下一步是尝试将外交特征注入我们日常的 AI 中。总体目标是整合程序方面，让人工智能展示外交和类似外交的行为。使用各种算法，尤其是最新的生成式 AI 或大型语言模型 (LLM)，在这方面取得了显着进展。

广告投放

我们将看一个这样的例子，CICERO，一个由 Meta AI 团队发布的新 AI 系统。

如果您正在度假并且没有跟上有关 AI 的最新消息，那么最近宣布和揭幕的 AI 系统被称为 CICERO，它提供了一个重要的路标，表明当今注入 AI 的外交舞台所处的位置。 Meta AI 团队经过深思熟虑并获得了良好的信誉，公开提供了他们开发的 CICERO AI 系统。您可以在已发布的研究论文中阅读技术细节科学，请参阅这里的链接. 你可以访问他们建立的网站，通过简短的视频剪辑来温和地传达 CICERO 的整体细微差别，以说明它的作用（见这里的链接). 对于那些寻求低头实际程序代码和软件的人，您可以在 GitHub 上找到源代码：这里的链接.

如果您选择深入研究这个问题，我确实想快速澄清一个可能看起来令人困惑的方面。

Meta AI 设计的特定 AI 系统目前被设置为玩一种有点流行的游戏，称为外交（也许您已经看过孩之宝和其他游戏制造商的棋盘游戏）。我提出这个问题是因为“外交”这个词在这种情况下将具有双重职责。一方面，设计的人工智能试图注入企业的特征并展示外交本身。同时，这个特定的 AI 系统发生的环境是在专门玩（现在）著名的棋盘游戏时外交.

您是否看到这可能会使某些人感到困惑？

如果有人对你说这个特定的人工智能在“外交”方面做得很好，你可能不确定他们是否指的是人工智能非常擅长玩棋盘游戏的概念外交或者他们可能是在暗示人工智能体现了与人类外交行为相关的核心本质。另外，这两个方面可能同时意味着（即 AI 擅长玩外交并且同时擅长将外交作为一种技能或行为来行使或展示）。

广告投放

在这里，我将尝试通过将第一个字母大写并以斜体显示棋盘游戏的名称来解决这个问题，外交. 其余时间，我将使用非斜体字的“外交”措辞来表示外交或展示外交的总体概念（看，我就是在那里做的）。

回到手头的问题，你可能会思考一下表现出外交能力的人工智能是我们应该渴望还是应该避免的。

让人工智能展示外交有很多积极的方面。尽管你生活在一个浅薄的泡沫中，但你会认为人工智能执行外交将完全是一件好事。 AI 似乎具有外交技能并且可以让我们相信它具有外交能力，但它也充满了我们需要提出来的令人不安的问题。从本质上讲，以这种方式使用人工智能会引发大量人工智能伦理和人工智能法律问题。对于那些对 AI 伦理和 AI 法感兴趣的人，您可以看看我对 AI 伦理和 AI 法的广泛和持续的报道，网址为这里的链接和这里的链接，仅举几例。

在跳入人工智能作为某种形式的外交之前，我想首先奠定一些关于人工智能的重要基础，特别是人工智能伦理和人工智能法律，这样做是为了确保讨论在上下文中是明智的。

广告投放

对道德 AI 和 AI 法的认识不断提高

最近的人工智能时代最初被认为是 永远的人工智能，这意味着我们可以使用人工智能来改善人类。紧随其后 永远的人工智能 意识到我们也沉浸在 坏的人工智能. 这包括被设计或自我改变为具有歧视性的人工智能，并在计算选择中灌输不正当的偏见。有时人工智能是这样构建的，而在其他情况下，它会转向那个令人讨厌的领域。

我想非常确定我们在当今人工智能的本质上是一致的。

今天没有任何人工智能是有感知的。我们没有这个。我们不知道有感知的人工智能是否可能。没有人能恰当地预测我们是否会获得有感知力的人工智能，也无法预测有感知力的人工智能是否会以某种计算认知超新星的形式奇迹般地自发出现（通常称为奇点，请参阅我的报道：这里的链接).

我关注的人工智能类型包括我们今天拥有的非感知人工智能。如果我们想疯狂地推测有感知的人工智能，那么这个讨论可能会朝着完全不同的方向发展。一个有感觉的人工智能应该具有人类的素质。你需要考虑到有感知的人工智能是人类的认知等价物。更重要的是，由于有人推测我们可能拥有超智能 AI，因此可以想象这种 AI 最终可能比人类更聪明（关于我对超智能 AI 可能性的探索，请参阅这里的报道).

广告投放

我强烈建议我们脚踏实地，考虑今天的计算非感知人工智能。

意识到今天的人工智能无法以任何与人类思维同等的方式“思考”。当你与 Alexa 或 Siri 互动时，对话能力可能看起来类似于人类的能力，但现实是它是计算性的，缺乏人类认知。人工智能的最新时代广泛使用了机器学习 (ML) 和深度学习 (DL)，它们利用了计算模式匹配。这导致人工智能系统具有类似人类的倾向。与此同时，今天没有任何人工智能具有常识，也没有任何强大的人类思维的认知奇迹。

对当今的人工智能进行拟人化要非常小心。

ML/DL 是一种计算模式匹配。通常的方法是收集有关决策任务的数据。您将数据输入 ML/DL 计算机模型。这些模型试图找到数学模式。在找到这样的模式之后，如果找到了，那么人工智能系统就会在遇到新数据时使用这些模式。在呈现新数据时，基于“旧”或历史数据的模式被应用于呈现当前决策。

我想你可以猜到这是走向何方。如果一直在做出模式化决策的人类已经纳入了不利的偏见，那么数据很可能以微妙但重要的方式反映了这一点。机器学习或深度学习计算模式匹配将简单地尝试相应地在数学上模拟数据。人工智能制作的建模本身没有常识或其他感知方面的外表。

广告投放

此外，人工智能开发人员可能也没有意识到发生了什么。 ML/DL 中的神秘数学可能使找出现在隐藏的偏见变得困难。您理所当然地希望并期望 AI 开发人员会测试潜在的隐藏偏见，尽管这比看起来要棘手。即使进行了相对广泛的测试，ML/DL 的模式匹配模型中仍然存在偏差。

您可以在某种程度上使用著名或臭名昭著的格言垃圾进垃圾出。问题是，这更类似于偏见，因为偏见潜伏在人工智能中。人工智能的算法决策 (ADM) 不言自明地变得充满了不公平。

不好。

所有这些都对人工智能伦理产生了显着的影响，并为试图为人工智能立法提供了一个方便的窗口（甚至在所有教训发生之前）。

广告投放

除了普遍采用人工智能伦理准则外，还有一个相应的问题是我们是否应该有法律来管理人工智能的各种用途。联邦、州和地方各级正在制定新的法律，这些法律涉及应该如何设计人工智能的范围和性质。起草和颁布此类法律的努力是一个渐进的过程。人工智能伦理至少可以作为一种权宜之计，并且几乎可以肯定在某种程度上将直接纳入这些新法律。

请注意，有些人坚决认为我们不需要涵盖人工智能的新法律，并且我们现有的法律就足够了。他们预先警告说，如果我们确实制定了其中的一些人工智能法律，我们将通过遏制人工智能的进步来提供巨大的社会优势，从而杀死金鹅。

在之前的专栏中，我介绍了各种国家和国际为制定和颁布监管人工智能的法律所做的努力，请参阅这里的链接，例如。我还介绍了各个国家已经确定和采用的各种人工智能伦理原则和指导方针，包括联合国的努力，例如联合国教科文组织的一套人工智能伦理，近 200 个国家采用，见这里的链接.

广告投放

以下是我之前仔细探索过的有关 AI 系统的道德 AI 标准或特征的有用基石列表：

用户评论透明
正义与公平
非恶意
责任
隐私政策
Beneficence
自由与自治
信任
永续发展
尊严
团结

AI 开发人员、管理 AI 开发工作的人员，甚至是最终部署和维护 AI 系统的人员，都应该认真使用这些 AI 道德原则。

在整个 AI 开发和使用生命周期中的所有利益相关者都被认为是在遵守 Ethical AI 的既定规范的范围内。这是一个重要的亮点，因为通常的假设是“只有编码员”或那些对 AI 进行编程的人才能遵守 AI 道德概念。正如前面所强调的，人工智能需要一个村庄来设计和实施，整个村庄都必须精通并遵守人工智能伦理规则。

广告投放

我最近还检查了 人工智能权利法案 这是美国政府官方文件“人工智能权利法案蓝图：让自动化系统为美国人民服务”的官方文件，这是科学和技术政策办公室（OSTP）一年努力的结果）。 OSTP 是一个联邦实体，负责就具有国家重要性的各种技术、科学和工程方面向美国总统和美国行政办公室提供建议。从这个意义上说，你可以说这个 AI 权利法案是由现有的美国白宫批准和认可的文件。

在 AI 权利法案中，有五个关键类别：

安全有效的系统
算法歧视保护
数据隐私
通知及说明
人类的选择、考虑和回退

我已经仔细审查了这些戒律，请参阅这里的链接.

广告投放

既然我已经为这些相关的 AI 伦理和 AI 法律主题奠定了有益的基础，我们就可以进入令人兴奋的 AI 注入的基于机器的外交主题。

人工智能外交的所有荣耀和潜在的垮台

首先，让我们确定此处考虑的 AI 类型是无感知 AI。

我这样说是因为如果，或者有人说 ，尤其是 当我们实现有感知力的 AI 时，整个主题可能会被彻底颠覆。想象一下，以某种方式进入一个以前从未见过且毫无疑问得到验证的领域，可能会造成混乱和社会混乱 人造的 体现感知力的智能（关于我对著名的 AI 测试图灵测试的分析，请参阅这里的链接). 你可以合理地打赌，我们现有的许多文化、法律和日常规范将彻底动摇。

也许有感知力的 AI 会成为我们的伙伴，或者有感知力的 AI 会成为我们最大的敌人。我们如何能够判断人工智能将走哪条路？

你可能会想说我们大概能够与 AI 交谈并从它所说的内容中弄清楚它所持有的意图。啊哈，你掉进了一个令人不安的陷阱。假设人工智能特别擅长某种形式的人工智能外交能力。当你尝试与 AI 交谈时，它可能会用最迷人、最雄辩的语言说话。这对人类来说可能是非常安慰的。

广告投放

但这真的是人工智能关于其基于人工智能的计算意图的“想法”吗？

AI 可能正在进行经典的外交一二拳。谈论一场精彩的比赛，让我们相信 AI 是我们有史以来最好的伙伴。这可能会让人工智能有时间积累资源以超越人类，或者可能正在幕后努力工作以削弱我们用来维持人类生存的其他一切。在那个聪明的外交停顿之后，砰的一声，人工智能把我们都打昏了。

记住 Will Rogers 所说的话，在这种情况下可能是 AI 告诉我们“Nice doggie”，我们给 AI 足够的呼吸空间，然后将我们从地球上抹去。长期以来，这种将人工智能视为存在风险的概念一直广为流传。一些人认为，通过在人工智能中注入外交手段，我们将被打败。 AI 会巧妙地使用我们帮助训练 AI 的所有注入的外交材料，最终，我们将被盲目地愚弄，让 AI 成为我们的霸主。

为我们感到羞耻。

对于那些对未来人工智能这个高度推测领域更感兴趣的人，请参阅我对人工智能作为生存威胁的观点的报道这里的链接.

广告投放

回到现实，我将在此强调我们现有的非感知人工智能中注入人工智能的外交途径。

让我们做一些历史追踪。

自 AI 早期以来，就一直在尝试设计以某种方式体现外交和外交行为的计算风格的 AI。你可以很容易地回到 1950 年代、1960 年代和 1970 年代，并找到渴望将 AI 应用于该领域的基础研究。有人认为博弈论是关键。其他人专注于心理学和相关的认知因素。其他人则尝试利用经济学、运筹学和无数看似相关的努力领域。

最初的鼎盛时期出现在 1980 年代。当时，一种主要方法包括使用专家系统 (ES) 或基于知识的系统 (KBS) 来构建与外交相关的人工智能系统。结果相当生硬，并倾向于证明这将是一项多么艰巨的任务。

广告投放

在这个初步调查的时代，一个棘手的难题是需要一个稳定的平台，在这个平台上，或者在这个平台上，一个据称能够以某些外交相关方式执行的人工智能可以得到充分的测试和探索。这种需要也许是显而易见的。如果有人想辨别人类或人工智能是否可以行使外交，就必须建立有利于这一探索的环境。

进入这张照片是棋盘游戏外交.

我意识到棋盘游戏外交远不如垄断, 风险或 西洋陆军棋 （您可能听说过这些游戏）。尽管如此，有一种战略棋盘游戏被称为外交于 1954 年首次设计并于 1959 年商业发行。除了面对面播放外，外交游戏通常通过蜗牛邮件进行。你会把你的动作写在一张纸上，然后把这张纸寄给你的对手。想象现在有点疯狂。后来，使用了电子邮件。最终，该游戏可以在线使用，并允许玩家彼此实时参与。

经外交随着游戏在微型计算机上可用，AI 专家开始使用该游戏作为测试他们注入 AI 的外交混合物的便捷手段。这外交游戏作为在 PC 上运行的应用程序提供，这样人类就可以与机器（即设计的 AI）对战。 1990 年代为玩而编写的 AI 外交众所周知，它缓慢、神秘，并且几乎可以被任何玩游戏的人轻易打败。

广告投放

这是 1999 年的评论外交正如雅虎上发布的那样，生动地描述了作为人类玩家对手的人工智能外交能力的悲惨状态：

“然而，外交最突出的问题是游戏中的人工智能绝对可怕。即使是在最高难度设置下，任何技能水平的游戏玩家都不会遇到任何问题。胜利只是时间问题和对界面的耐心。这并不是说计算机不会在你背后策划——它确实会，而且它经常与盟友合作从你手中夺走一两块领土——但这样的策划是断断续续的，而不是连续的或特别的具有挑战性的威胁。”

人工智能设计的一个特别令人烦恼的弱点是它似乎缺乏同时计算多个动作或策略的能力：“在更基本的层面上，计算机似乎无法管理多个战略动作。虽然人类玩家可以同时对希腊和比利时发动攻击，但计算机似乎总是一次只关注一件事。因此，计算机根本无法与人类玩家竞争”（同上）。

我还没有向你解释什么外交棋盘游戏包括，所以让我们花点时间来建立基本规则。

有一篇关于 AI 和游戏的便捷研究论文外交简明扼要地描述了游戏的本质：“游戏发生在 1901 年的欧洲地图上，该地图分为 75 个省。每个玩家扮演当时的七大强国之一：奥地利 (AUS)、英格兰 (ENG)、法国 (FRA)、德国 (GER)、意大利 (ITA)、俄罗斯 (RUS) 和土耳其 (TUR)，每个玩家以三个或四个单位（军队或舰队）开始，它们被放置在地图上固定的初始位置。在游戏的每一轮中，每个玩家都必须为其每个单位“提交命令”，告诉这些单位如何在地图上移动并允许他们征服地图的省份”（Dave de Jonge、Tim Baarslag、Reyhan Aydogan 、Catholijn Jonker、Katsuhide Fujita 和 Takayuki Ito，“外交游戏中谈判的挑战”， 协议技术：第六届国际会议， 在 2018)

广告投放

您还需要了解游戏的获胜方式和失败方式：“某些省份是所谓的 供应中心 玩家的目标是征服那些补给中心。当一名玩家失去他或她的所有补给中心时，他或她将被淘汰；当一名玩家征服 18 个补给中心中的 34 个或更多（单人胜利）时，他或她将赢得比赛。但是，当所有幸存的玩家都同意平局时，游戏也可能结束”（同上）。

我相信你能看到外交是一个简单的游戏，最多有 XNUMX 名玩家试图从战略上战胜对方。在此操作过程中，玩家可以互相商议，而其他玩家不知道他们在做什么。外交行为通过能够让其他玩家同意你的计划而脱颖而出。你可能会透露你的真实计划，也可能不会。你可能会提出错误的计划。您可以与其他玩家协商。您可以欺骗其他玩家。您可以与其他玩家结成联盟。等等。

正如他们所说，在爱情和战争中一切都是公平的。

我选择了那篇特定的研究论文，因为它有助于建立计算机化版本的变体外交叫游戏作为测试人工智能外交能力的前瞻性平台：“长期缺乏共享应用领域来测试多代理系统中的高级研究模型和代理协商架构。在本文中，我们为此目的介绍了一个友好的测试平台。试验台是基于 外交游戏 其中谈判和参与者之间的关系发挥着至关重要的作用”（同上）。这个和许多其他变体外交已被制作并可用于研究和玩耍。

广告投放

研究人员解释了为什么他们认为外交是一款非常有用的游戏，可以帮助 AI 探索融入 AI 的外交：“The game of 外交为这类复杂的谈判形成了一个很好的测试案例，因为它是一个包含许多在现实生活中的谈判中也必须面对的困难的游戏。它涉及约束满足、联盟形成、博弈论、信任，甚至心理学。既然现代国际象棋和围棋计算机已经远远优于任何人类棋手，我们预计外交将作为计算机科学的下一个重大挑战开始引起更多关注”（同上）。

快速回顾一下，棋盘游戏外交提供了一种已知且颇为流行的工具，用于让人类以各种外交方式行事。通常，人类与其他人类比赛（在这种情况下，最多 XNUMX 名人类玩家）。我们可以设计出尝试在游戏中扮演玩家角色的人工智能。因此，您可能有六名人类玩家和一名人工智能玩家。

设想演奏外交线上。

如果我们不告诉人类玩家他们中间有一个人工智能，他们可能会自然而然地认为第七名玩家只是另一个人类玩家。为了尝试防止任何人类玩家猜测 AI 正在玩游戏，我们可以将游戏方面限制为要求所有玩家相互发送面向文本的消息。您无法直接看到其他玩家。

广告投放

您可能会认为这与玩在线国际象棋似乎并没有什么特别不同。为什么大惊小怪外交作为游戏？

回想一下，我们关注的是玩家之间的互动。这个游戏的前提是玩家互相调用外交。这不同于传统的国际象棋。如果我开发一款基于人工智能的国际象棋应用程序，它通常会与一个人对弈。下棋的 AI 和人类棋手之间没有任何协商或讨论。他们只是下棋并试图超越对方。这通常是在完全安静的情况下完成的。

外交允许我们进行直言不讳的计算和以人为本的外交（可能以书面形式而不是大声说出来）：“两者之间的主要区别外交与国际象棋和围棋等其他确定性游戏的不同之处在于，在外交中，玩家可以相互协商并结成联盟。在每一轮中，在玩家提交订单之前，玩家有时间相互协商并就他们将提交的订单达成一致。谈判是私下进行的，达成的每项协议只有参与该协议的参与者才知道”（同上）。

你能想出其他一些利用互动外交而不是依赖游戏的游戏吗外交?

绝对。

广告投放

有各种各样的游戏。

选择一款特定游戏的便利之处在于，AI 开发人员可以将注意力集中在该特定游戏上。你可以围绕设计在特定环境中执行外交的 AI 进行集会。您可以分享方法并对比它们。您可以根据与该游戏相关的指标对 AI 的各种实例进行评分。等等。

话虽这么说，反驳或表达的担忧是，这就像把所有的鸡蛋放在一个篮子里。有些人担心，如果许多 AI 开发人员变得专注于某个特定平台或环境，例如在这种情况下外交，他们将寻求针对特定领域优化 AI。不利的一面是人工智能不会被推广。我们不会在人工智能外交的总体能力方面取得太大进展。

如果你愿意的话，有点像只见树木不见森林。

另一个经常表达的担忧是游戏，例如外交仅仅是游戏。

广告投放

棘手的问题是，玩游戏的人是否正在做他们在现实世界外交中所做的相同事情。当民族自豪感或国家利益不受威胁时，您可能不会以同样的方式行事。当然，你可能会在玩游戏时担心你的个人尊严，或者可能会担心成为最佳射手，甚至可能会赢得奖金，但这仍然等于在联合国谈判世界和平或为哪些国家讨价还价应该拥有或不拥有核武器。

有些人认为这些外交游戏是现实世界的缩影。其他人则感叹，这些运动会很有用，但没有扩大到国际口径的众所周知的橡胶遇到道路的外交。人工智能外交的游戏版本可能只是游戏的成功。天哪，在玩涉及外交的游戏时，设计出的 AI 可以获胜或做得非常好，但事实证明，在真正的外交环境中使用相同的 AI 是非常缺乏的，而且会步履蹒跚或悲惨地失败。

暂时假设 AI 是为玩游戏而设计的，例如外交确实值得。你可以合理地争辩说，无论是只适合玩游戏还是适合现实世界的行动，这个想法都需要扩展 AI 的边界并在 AI 方面取得进步，这可能有助于外交或可能在创造 AI 方面取得其他有利的突破。

广告投放

现在喜欢笑脸。

接下来我们将研究 Meta AI 如何选择创建一个可以在游戏中执行的 AI 注入的外交玩家外交.

抓住你的帽子。

元人工智能和基于外交机器的外交官西塞罗

如前所述，有一篇研究论文发表在科学它描述了新宣布和公开发布的 Meta AI 应用程序，创造了 Cicero（在整个讨论中，我将互换地称其为“Cicero”，同样地，“CICERO”的全大写绰号）：

广告投放

“我们展示了 Cicero，这是一个在策略游戏中达到人类水平表现的人工智能代理外交。在外交，七名玩家进行私人自然语言协商以协调他们的行动，以便相互合作和竞争。相比之下，多代理 AI 先前的主要成功是在纯粹的对抗环境中，例如国际象棋、围棋和扑克，在这些环境中，交流没有价值。由于这些原因，外交已成为多主体学习的具有挑战性的基准”（Meta Fundamental AI 研究外交团队，“通过将语言模型与战略推理相结合，在外交游戏中进行人类水平的游戏”，科学，22年2022月XNUMX日）。

我将引用这篇论文，然后提供各种见解，希望您会感兴趣。

鉴于 AI 刚刚可用，我可能会在有机会对代码进行一些深入的实践评估并进行一些实验性游戏以评估 AI 能力（例如主要优势和劣势）。

请注意稍后的发布！

不管怎样，我相信你可能已经在我刚才引用的那段话中观察到，有一句话说人工智能“在战略游戏中达到了人类水平的表现” 外交设立的区域办事处外，我们在美国也开设了办事处，以便我们为当地客户提供更多的支持。“

广告投放

仔细考虑一下。

首先，能够设计出能够发挥外交以类似于人类的所谓性能水平进行游戏。这是非常重要的。

我们有很多外交与玩 AI 的人类相比，玩 AI 的效果不佳外交游戏。超过你可以动摇的棍子。朝着可以更好地玩游戏的 AI 发展是令人欣慰和兴奋的。不过，我们确实需要谨慎地就此得出任何快速结论。

例如，假设我设计了 AI 来玩外交我将它与以前从未玩过游戏的人类玩家进行了对比。如果我的 AI 打败了他们，那么说我的 AI 已经达到了人类水平的表现就有点夸张了。它对不熟悉游戏的人类这样做的事实有点令人侧目和可疑。

广告投放

我提出这个问题是为了预先警告你要始终仔细检查任何看似过分的关于 AI 的说法。之前关于人工智能伦理和人工智能法律的讨论可能会让你看到关于人工智能的错误主张的可能性。有完全错误的说法，也有那些阴险的部分真实和部分误导性的说法特别棘手。关键是要问为什么那些声称他们的 AI 的人会这样做。

哪里的牛肉？

以下是 Meta AI 团队就其人类水平性能声明的基础不得不说的内容（有关更多详细信息，请参阅论文）：

“从 40 年 19 月 13 日到 2022 月 10 日，西塞罗在 webDiplomacy.net 的“闪电战”联盟中匿名参加了 2 场外交比赛。这个联盟进行了五分钟的谈判；这些时间控制允许游戏在两个小时内完成。西塞罗在参加超过一场比赛的参与者中排名前 19%，在参加 5 场或更多比赛的联盟 40 名参与者中排名第二。在所有 25.8 场比赛中，西塞罗的平均得分为 12.4%，是其 82 名对手平均得分 8% 的两倍多。作为联赛的一部分，西塞罗参加了一场 21 场比赛，共有 6 名参赛者参加，其中 5 人至少参加了 6 场比赛。参与者最多可以玩 3 场比赛，他们的排名由他们最好的 1 场比赛的平均值决定。西塞罗在这次比赛中排名第一”（同上）。

广告投放

看到他们在这种情况下认真地尝试支持他们的 AI 主张，我感到非常欣慰（请注意，并非 AI 中的每个人都这样做）。

您可以建议他们进行一项实验。该实验由人类玩家组成，他们大概不知道他们正在与他们中间的 AI 玩家一起玩（该论文讨论了为什么这似乎是合理的推断，即人类没有公开意识到其中一名玩家是 AI，尽管一个有趣的旁白涉及一个玩家的故事，他有点怀疑但不是特别如此）。这些人类球员是根据实验设计的性质预先选择的，因此他们是联盟球员外交我们可以合理地推断他们很清楚如何玩这个游戏。他们不是新手。

根据报告的统计数据，我们将按照以前的表面价值进行适当收集和报告（补充材料中提供了各种数据和代码），AI 似乎已经玩了足够多的游戏以做出看似合理但范围狭窄的结论对于这个变体，它达到了人类的表现水平外交游戏以及在所述联赛的背景下与看似精通玩家的人类比赛。

我敢肯定，你们中的一些人可能想对玩这款游戏的次数提出异议，也许会争辩说它太少了，无法做出大胆的声明。另一个狡辩可能是，在参与者的前 10% 之内还不够高，因此在达到前 1% 之前，人们不应该吹嘘人工智能的表现。

广告投放

那些狡辩似乎有点刺耳。

我这么说是因为幸运的是没有援引“超人”的说法。读者无疑知道我对 AI 中那些不断夸大其 AI 已经达到超人地位的人的看法。我不会在这里抱怨超人的叫嚣，请看这里的链接我的意见。

我在这个例子中的观点是，我相信人类水平表现的指示可能通常是允许的，假设每个人都记住这是在一个极其狭窄的范围内并且我们不试图使它成为所谓的超人。我也一遍又一遍地重复受限的上下文，原因我将在接下来阐明。

我可以想象，一些社交媒体或天真的（可能声名狼藉的）记者将完全断章取义人类水平的表现概念。

这就是我害怕的。

广告投放

屏住呼吸。

有些人会声称人工智能已经掌握了外交。是的，一项针对外交人工智能系统的研究毫无疑问地证明，人工智能可以而且现在有能力完成人类为外交所做的一切事情。

把外国外交官送回家。我们可以用人工智能代替它们。

我们所知道的世界已经改变。我们已经生产出在外交方面与人类完全平等的人工智能，我们可以在思想上“合乎逻辑”地飞跃到人工智能现在可以做人类可以做的任何事情。瞧，我们现在已经证明人工智能与人类不相上下。显然，这项研究为有知觉的人工智能提供了明确的证据。

记住我的话，这肯定会成为一些作家的古怪、不负责任、令人厌烦的看法。

我不会强调这一点。我们继续前进。

广告投放

人工智能是如何工作的？

以下是该论文的简要总结：“Cicero 将可控对话模块与战略推理引擎相结合。在游戏的每一点，西塞罗都会根据游戏状态和他们的对话来模拟其他玩家可能采取的行动。然后，它计划参与者如何协调以实现互惠互利，并将这些计划映射到自然语言消息中”（同上）。

那个简短的总结中包含了很多内容。

请允许我拆包。

玩游戏的人类玩家外交必须预测其他人类玩家将要做什么。您想尝试与其他玩家协商并让他们同意您的计划。他们会尝试对你做同样的事情。他们可能在骗你。你可能在骗他们。您必须与其他六名玩家竞争，他们都有自己的计划和方法。

广告投放

该游戏的多代理方面对于设计玩游戏的 AI 的难度级别至关重要。人工智能必须跟踪每个人可能想做什么，以及他们所说的他们想做什么，以及他们对其他玩家所做的任何诡计。这必须与他们告诉你他们将要做的事情以及你告诉他们你将要做的事情进行权衡。

令人眼花缭乱，但通常对人类来说足够容易。

用 AI 领域的说法，我们将其称为心智理论 (ToM)。想想你，作为一个人，倾向于对其他人的想法进行理论化。你不能撬开某人的脑袋看他们的想法。你必须猜测他们的想法是什么。你可以问他们，但他们告诉你的可能是他们的想法，也可能是他们想法的偷偷摸摸的版本。

除了心理理论的复杂性之外，我们还需要将人类语言添加到这种模糊的组合中。

当一个人用他们的自然语言与您交流时，比方说英语，就会有很多错误和误解的余地。我告诉你我要接管 X 国，但我错说了 Y。哎呀。或者，我说的是 X 国，但你误以为我说的是 Y 国。如果你认为如果每个人都使用短信就不会发生这种混淆，那你就大错特错了。我可能会输入一条消息，说我要攻击一个国家，但我没有提到是哪个国家。也许这暗示了我“显然”会攻击哪一个。收到我消息的玩家可能会认为我一定是在暗示 X 国家，但也许我希望他们这么想。

广告投放

不断下去。

关键在于我们在自然语言处理 (NLP) 方面的 AI 最新进展，尤其是最新的生成 AI 和大型语言模型 (LLM) 使这种自然语言情况几乎可行。过去，NLP 通常不够好，同样，LLM 也没有更成熟。

过去，AI 会发送您几乎肯定会立即认出是由脚本化 AI 系统编写的消息。措辞不流畅。它被模板化了。这很明显表明 AI 就是 AI。如今，在这些情况下更难辨别人工智能不是人类玩家。

正如上面的引述所提到的，这个特殊的人工智能被设计成包含一个“带有战略推理引擎的可控对话模块”（同上）。对话来自于：“西塞罗使用预先训练的语言模型生成对话，该模型进一步训练了来自人类游戏的对话数据。外交. 至关重要的是，除了基于对话历史和游戏状态之外，对话模型还经过训练，可以通过意图进行控制，我们在这里将其定义为代理及其说话伙伴的一组计划动作。”

广告投放

在那里，请注意域设置是至关重要的。如果你只接受了互联网上正常性质的对话的训练，这不一定适合外交游戏上下文。玩游戏的人习惯于用一种速记的方式来讨论游戏和提议的走法。你希望 AI 也这样做。因此，在特定领域的对话数据上训练语言模型是一种值得注意的方法。

对于所述的战略推理引擎，他们是这样说的：“西塞罗使用战略推理模块来智能地选择意图和行动。该模块运行一个规划算法，根据到目前为止的游戏状态和对话预测所有其他玩家的策略，同时考虑不同动作的强度及其在人类游戏中的可能性，并根据这些预测为西塞罗选择最佳动作. 规划依赖于通过 self-play RL 训练的价值和政策功能，它会惩罚偏离人类行为太远的代理，以维持与人类兼容的政策”（同上；请注意 RL 是强化学习的缩写）。

在游戏中，玩家在每次移动后都会重新校准自己的位置。你不能用一个固定的、僵化的、一成不变的预定义策略进入这个游戏。你必须根据其他玩家的行为来改变你的行为。人工智能应该被编程为做同样的事情。本身没有静态策略。相反，要不断了解情况，一步一步，找出下一步应该采取的最佳步骤。

AI 的技术基础是这样设计的：“我们获得了 125,261 个游戏的数据集外交在 webDiplomacy.net 上在线播放。其中，40,408 个游戏包含对话，玩家之间交换的消息总数为 12,901,662 条。玩家帐户被取消识别，个人身份信息 (PII) 的自动编辑由 webDiplomacy 执行。我们在下文中将此数据集称为 WebDiplomacy”（同上）。

类似于你训练 AI 下棋的方式，你可以抓住无数的棋局，让 AI 对棋局进行模式匹配，这个 AI 外交游戏玩法相对成立。

那些精通 AI 的人可能很好奇他们使用了哪些基础模型，你看：“我们将 R2C2 (22) 作为我们的基础模型——一个 2.7B 参数的基于 Transformer 的编码器-解码器模型在来自互联网的文本使用 BART 去噪目标。然后，通过标准最大似然估计，在 WebDiplomacy 上进一步训练基础预训练模型”（同上）。

此外，他们采取了一种有点不寻常且有趣的方法来对其他参与者的模型进行建模，以考虑他们的推定政策：“合作游戏中的一种流行方法是通过对人类数据的监督学习来模拟其他参与者的政策，这通常是被称为行为克隆（BC）。然而，纯 BC 是脆弱的，特别是因为监督模型可能会学习对话和动作之间的虚假相关性。为了解决这个问题，Cicero 使用 piKL (26) 的变体来模拟参与者的策略。 piKL 是一种迭代算法，它通过假设每个参与者 i 寻求最大化其策略 πi 的期望值并最小化 πi 与 BC 策略之间的 KL 差异来预测策略，我们称之为锚策略 τi（同上）。

我认为这涵盖了最重要的方面，并让您大致了解 AI 做了什么以及它如何完成指定的任务。

结论

还有很多我想提的，但我在这个讨论上跑了很长时间，并会尝试只涵盖几个关键方面。我的目标是在随后的帖子中介绍更多内容。

你听说过囚徒困境吗？

这是一个经典的决策相关问题。

囚徒困境涉及您必须决定是出卖还是向其他囚犯吐槽。另一个囚犯也可能出卖你。有一个奖励功能，如果你出卖了另一个囚犯而他们没有出卖你，这对你来说是一种胜利。如果他们出卖你而你不出卖他们，这对他们来说是一种胜利，对你来说是一种失败的姿态。如果你们都互相出卖，你们基本上都输了。详细见我的报道这里的链接.

面对囚徒困境时，你会想出什么策略？

如果这是一次性交易，您几乎可以抛硬币。如果这种情况一次又一次地重复，而你面对的是同一个囚犯，你可能会发现一种可能出现的模式。最受欢迎和经常推荐的模式之一被称为 针锋相对. 无论其他囚犯做了什么，你的下一步都会做同样的事情。如果他们不出卖你，你就不会出卖他们。如果他们真的出卖了你，你就可以在下一步中出卖他们。

你可能会感到困惑，这与玩游戏时注入 AI 的外交有什么关系外交.

这笔交易。

在与他人的谈判中，你常常不得不决定是告诉他们真相还是对他们撒谎。说谎的一个问题是，如果你被骗了，对方可能从此不再信任你。他们可能一开始并没有完全信任你，但现在你已经证明你确实在撒谎，他们肯定会认定你是个骗子。

一些球员的外交经常撒谎。他们认为这是最好的策略。谎言，谎言，还有更多的谎言。其他玩家则完全相反。他们争辩说，如果可以的话，你想避免说谎。只在最需要的情况下使用谎言。通过避免说谎，您可以与其他玩家建立信任。一旦你走上说谎的道路并被发现，没有人会相信你说的话。

描述西塞罗的论文提到了这一考虑：“最后，外交是一个特别具有挑战性的领域，因为成功需要在鼓励玩家不信任任何人的环境中与他人建立信任。在不具约束力的私下谈判之后，每个回合的行动同时发生。为了取得成功，经纪人必须考虑到球员可能不守信用的风险，或者其他球员自己可能会怀疑经纪人的诚实度的风险”（同上）。

根据论文和短视频，研究人员最终发现，让 AI 尽可能多地说实话似乎是更好的整体策略。从某种意义上说，你可以把这比作囚徒困境中的针锋相对。从说实话开始。如果你的对手说真话，你就继续说真话。如果他们开始说谎，您需要评估是坚持说实话还是转而说谎。

人们认为这是一个令人心动的发现。

请记住，棘手和有趣的部分外交是您针对其他六个玩家执行此操作（称为多代理问题）。你可能对他们所有人都非常诚实。或者，也许对某些人诚实但对其他人不诚实。还有一个方面是，一旦您对其他玩家撒谎并被骗，其他玩家可能会观察到或推断出这一点。因此，你被认为或被认为在撒谎，即使你没有对某个特定玩家撒谎，你希望他认为你是诚实的并且你正在努力对他诚实。

人类在行使外交时往往会弄清楚并发展他们的谎言真相方法。情境依赖性可能是一个很大的因素。线路上的利害关系是至关重要的考虑因素。有多种因素在起作用。

注入 AI 会很有趣外交基于机器的玩家玩了大量的游戏，主要是看结果可能暗示什么。

我们可能还想让 AI 与少于 XNUMX 名其他玩家进行较量，看看这会如何改变事情。我们还可以将 AI 添加到组合中，使其成为多个玩家。例如，假设我们有五个人类玩家和两个 AI 玩家（我们将 AI 玩家设置为单独的实例，这样他们在计算上就不会相同）。四个人和三个人工智能呢？六个人工智能和一个人类怎么样？

另一种途径是让 AI 单独对抗 AI。以这种方式，我们可以快速完成无数场比赛。七个不同的 AI 实例的设置。每个都是自己独立的播放器。由于这一切都在计算机内，我们可以不间断地运行它们并产生数千或数百万个游戏实例。

当然，AI 对 AI 的问题在于我们移除了人类玩家。我们不知道 AI 对 AI 是否反映了人类玩家的行为。无论如何，可能会发现一些有趣的结果。

我之前说过，这类 AI 的一个局限性是它通常专注于狭隘的领域。我们无法轻易知道播放的 AI 外交将适用于现实世界的外交。此外，也许适用于外交在其他以外交为导向的在线游戏中不会做得特别好。它可能不会移植过来，而是一种只会一招的小马。

正如有关配方的研究所述游戏:

“我们认为，在真正的谈判中，了解领域很重要，而且应该能够对此进行推理。例如，一个人不能指望在没有任何古董知识的情况下在古董业务中赚取利润，无论一个人在讨价还价方面多么擅长。此外，一个好的谈判者还应该能够推理对手的愿望。例如，一个优秀的汽车推销员会尝试找出最适合客户需求的汽车类型，以增加达成有利可图的交易的机会”（如前所述：Angela Fabregues 和 Carles Sierra，“DipGame：具有挑战性的谈判试验台”， 人工智能的工程应用， 2011 年 XNUMX 月）。

一旦掌握了人工智能外交发生这种情况时，所有的目光都应该集中在使用或重复使用 AI 来处理其他与外交相关的游戏上。此外，应探索在现实世界的外交环境中使用人工智能的努力。

我将暂时结束一些关于道德 AI 的考虑。

首先，令人欣慰的是，Meta AI 团队认识到他们的工作包含 AI 伦理分支。发人深省的问题出现了。在不告诉人们他们正在这样做的情况下“愚弄”人们与 AI 对战是否合适？人工智能生成的自然语言是否会无意中包含传达给人类玩家的冒犯性措辞？等等。

一定要看看他们如何在他们论文的补充材料 (SM) 中处理那些紧迫的人工智能伦理问题：“我们在 SM 中进一步讨论了这项研究的伦理考虑，包括数据使用的隐私考虑 (SM, § A.1）、有毒或有偏见的语言生成造成的潜在危害（SM，§A.2）、滥用面向目标的对话技术的途径（SM，§A.3）以及向人类玩家披露 AI 代理（SM , §A.4)”（同上）。

我们需要更多的 AI 开发人员和他们的领导层认识到有道德的 AI，并在他们所做的 AI 工作中采取谨慎和明智的步骤。此外，他们需要确保他们对他们采取的道德人工智能行动以及他们所做的假设保持透明。

我现在的最后一项是对 拟人化 AI。

如果我们改进 AI 使其看起来具有敏锐的外交能力，这是否会误导人类假设或相信 AI 在最充分的方面与人类不相上下？

这是一个容易滑的斜坡。与你互动的笨重 AI 正在提供一个明显的线索，表明它可能是 AI 而不是人类。一个平滑迭代的人工智能，表面上有至高无上的外交姿态，很可能会让人毫不犹豫地陷入人工智能是人类的陷阱，包括好像它具有人类的常识和人类的所有理解能力。

顺便说一句，还要意识到这可能会如何在外交游戏。一个人类玩家看到来自另一个玩家的近乎诗意的消息可能会意识到这一定是人工智能（现在远远超过了之前笨拙的人工智能），而其他人则不会如此清晰地撰写消息。当然，如果 AI 继续调整，它可能会改变诗意的措辞，以更接近地反映真实人类玩家的简洁和松散的措辞。反过来，人类玩家可能会转而使用诗意的语言，试图表明他们是人类。这个想法是，也许其他人类玩家会愿意在 AI 问题上与人类同胞结盟。

接下来你知道，游戏开始转变为试图弄清楚谁是人类，谁是人工智能。如果你能弄清楚哪个是哪个，也许这会给你带来优势。另一方面，它可能不是。人工智能最终可能会像人类一样精通游戏。你猜测哪个是哪个对你没有多大好处。无论是人工智能玩家还是人类玩家，它都可能会分散注意力，无法专注于赢得比赛。

对于希望对这种令人费解的概念进行人为因素研究的研究人员，您可以考虑使用注入 AI 的外交玩家并寻找愿意外交联赛调查人类与人工智能的识别和出现的行为适应策略。

让我们总结一下。

马克吐温谈到外交时这样说：“给予和接受的原则就是外交的原则——给予一个，得到十个。” 这是对人类如何运作的诚实评估，还是只是一种玩笑式的幽默，愤世嫉俗但错误地评估了人类状况？

进一步思考这些问题：

如果我们可以将外交融入人工智能，这是否会告诉我们人类如何实例化外交并可能让人类提高外交艺术？
我们是否会制造一种虚假的 AI，当它根本不是那种东西时，它似乎是有知觉的，所有这些都是由于通过计算从帽子里拉出一只兔子来看似展示类似人类的外交？
是否可以在让 AI 充满外交能力之间找到平衡点，以便同时提醒我们这仍然只是日常 AI，因此不要将其拟人化？

他们说外交是让别人为所欲为的艺术。让我们确保我们的方式是人类方式，而不是人工智能方式。虽然是外交，但现在我仔细考虑了一下，如果我们最终成为 AI 霸主，也许我们应该允许我们的方式成为 AI 方式，这有望与合适的人类方式相吻合。

只是想运用一点巧妙的外交手段。

来源：https://www.forbes.com/sites/lanceeliot/2022/11/23/meta-ai-unveils-ai-infused-diplomatic-charmer-which-stirs-ai-ethics-and-ai-law-进入-indelicate-tiff/