生成式人工智能近亲繁殖：人工智能开发中日益受到关注的问题

随着人工智能 (AI) 的进步，人工智能 (AI) 也在不断进步，生成型人工智能系统中所谓的“近亲繁殖”风险成为一种危害，在人类和家养动物群体中长期存在。

本文将从生成人工智能的角度阐明近亲繁殖的概念，以及近亲繁殖如何与人工智能生成内容的未来相关。

了解生成式 AI 近亲繁殖生成式 AI 系统（例如大型语言模型 (LLM)）主要基于来自网络上可用的文本、视觉和音频内容的综合数据集进行训练。最初，数据集主要包括人类制作的物品，例如文学、文章和艺术品。然而，随着生成式人工智能工具的兴起，互联网上越来越多的内容是由人工智能本身编写的。

这种转变引发了人们对用于训练未来人工智能系统的数据集的质量和多样性的担忧。随着人工智能生成内容的发展，预计许多未来的人工智能模型将从不代表人类内容而是代表人工智能创建的材料的数据集中学习。

生成式人工智能近亲繁殖的后果是多方面的。

相反，人工智能系统继续从越来越多的同质数据集中学习可能会导致人工智能生成的输出的创造力和原创性下降。

如果这个过程连续几代人重复（即从副本中复制），产出的质量就会被稀释，结果就会面临工作吸引力降低、不太可能反映我们所认为的人类创造性产出的风险。。随着在近交数据集上训练的人工智能生成内容的增长，此类问题可能会加剧。

如果训练数据集不够多样化，那么开发的人工智能系统只会强化和放大人工智能生成内容中存在的偏见，从而进一步破坏人工智能生成内容作为信息来源的可信使用。此外，训练数据缺乏多样性可能会限制开发能够正确理解和代表各种人类经验和观点的人工智能系统的可能性。这可能会限制人工智能不同应用领域的进展，例如自然语言处理、内容生成和决策系统。

应对生成式人工智能近亲繁殖的挑战

最重要的是，这是一个真正的风险，尤其是生成式人工智能技术的近亲繁殖。尽管如此，它还是让研究人员、开发人员甚至政策制定者有责任积极采取行动，确保在人工智能系统的训练过程中将使用多样化且具有代表性的数据集作为首要任务，整合能够检测和减少的机制人工智能生成内容中的偏见，确保有效的跨学科合作，同时解决并确保构建人工智能的道德和社会影响得到照顾。

他们应该进一步促进人工智能系统部署中开放性和问责制的需求，并要求与人工智能生成内容的用户分享对局限性和偏见的认识。因此，所有利益相关者都可以积极寻求合作，利用生成式人工智能的力量，同时减轻人工智能开发中近亲繁殖相关的风险。

生成式人工智能中近亲繁殖的概念对于人工智能系统的开发和部署来说是一个巨大的未来挑战。这将帮助他们通过了解有效改善人工智能近亲繁殖的影响和方法，确保社会技术进步的负责任和道德的发展得到满足。

资料来源：https://www.cryptopolitan.com/generative-ai-grinding-in-ai-development/