Press "Enter" to skip to content

探索全球人工智能治理机构

新白皮书探讨国际机构的模型和功能,以帮助管理先进人工智能的机遇和减轻风险

对先进人工智能(AI)的全球影响日益增长的认识,激发了关于需要国际治理结构来帮助管理机遇和减轻涉及的风险的公众讨论。

许多讨论都以国际民航组织(ICAO)在民航领域、欧洲核子研究组织(CERN)在粒子物理学领域、国际原子能机构(IAEA)在核技术领域以及其他许多领域的政府间和多利益相关方组织作为类比。然而,尽管类比可以作为一个有用的起点,但从AI中出现的技术将与航空、粒子物理学或核技术不同。

要成功进行AI治理,我们需要更好地理解:

  1. 我们需要国际管理哪些具体的利益和风险。
  2. 这些利益和风险需要哪些治理功能。
  3. 哪些组织能够最好地提供这些功能。

我们最新的白皮书与牛津大学、蒙特利尔大学、多伦多大学、哥伦比亚大学、哈佛大学、斯坦福大学和OpenAI的合作伙伴们一起,回答了这些问题,并调查了国际机构如何帮助管理前沿AI发展的全球影响,并确保AI的利益惠及所有社区。

国际和多边机构的关键作用

获得某些AI技术可以极大地增强繁荣和稳定,但这些技术的好处可能不会均匀分布或聚焦于弱势社区或发展中国家的最大需求。网络服务的不足、计算能力的不足、机器学习培训或专业知识的不足也可能阻止某些群体充分从AI进步中受益。

国际合作可以通过鼓励组织开发满足弱势社区需求的系统和应用程序,以及改善教育、基础设施和经济方面的障碍,帮助解决这些问题,以便这些社区充分利用AI技术。

此外,国际努力可能是管理强大AI能力带来的风险的必要手段。如果没有足够的保障措施,这些能力中的一些(例如自动化软件开发、化学和合成生物学研究以及文本和视频生成)可能会被滥用以造成伤害。先进的AI系统也可能以难以预料的方式发生故障,如果技术不负责任地部署,可能会产生具有国际后果的事故风险。

国际和多利益相关方机构可以帮助推动AI发展和部署协议,以最小化这些风险。例如,它们可以促进全球就不同AI能力对社会的威胁达成共识,并制定关于具有危险能力的模型的国际标准以及其处理的标准。对安全研究的国际合作也将进一步提高我们使系统可靠且不易被滥用的能力。

最后,在国家有动机(例如源自经济竞争)削弱彼此的监管承诺的情况下,国际机构可以帮助支持和激励最佳实践,并监督符合标准的情况。

四种潜在的机构模型

我们探索了四种互补的机构模型来支持全球协调和治理功能:

  • 一个政府间的前沿AI委员会可以在国际上就先进AI的机遇和风险达成共识,并就如何管理这些机遇和风险提供科学知识,增加公众对AI前景和问题的认识,并为决策者提供专业知识。
  • 一个政府间或多利益相关方的高级AI治理组织可以帮助国际化和协调应对先进AI系统全球风险的努力,制定治理规范和标准,并协助实施。它还可以执行对任何国际治理体制的合规性监测功能。
  • 一个前沿AI合作可以作为国际公私合作伙伴关系,促进对先进AI的访问。通过这样做,它将帮助弱势社会从尖端AI技术中受益,并促进国际间对AI技术的安全和治理目标的访问。
  • 一个AI安全项目可以汇集领先的研究人员和工程师,并为他们提供计算资源和先进的AI模型,以研究技术缓解AI风险。通过增加规模、资源和协调,这将促进AI安全研究和发展。

运营挑战

这些机构模型的可行性仍存在许多重要的未解之问。例如,鉴于人工智能轨迹和能力的极度不确定性以及迄今为止在高级人工智能问题上的有限科学研究,一个高级人工智能委员会将面临重大的科学挑战。

人工智能进展的快速速度和公共部门在前沿人工智能问题上的有限能力,也可能会使高级人工智能治理组织难以制定与风险情景保持同步的标准。国际协调的诸多困难也引发了一个问题,即各国将如何受到激励采纳其标准或接受其监测。

同样,社会充分利用先进人工智能系统(和其他技术)的好处面临许多障碍,这可能会使前沿人工智能合作难以实现其影响的最大化。在分享人工智能的好处和防止危险系统扩散之间,也可能存在难以处理的紧张关系。

对于人工智能安全项目来说,重要的是要仔细考虑哪些安全研究方面最适合通过合作进行,而不是依靠公司的个体努力。此外,一个项目可能难以从所有相关开发者那里获得足够的最先进模型来进行安全研究。

鉴于人工智能系统在未来带来的巨大全球机遇和挑战,政府和其他利益相关方之间需要更多的讨论,以探讨国际机构的作用以及它们如何进一步推动人工智能治理和协调。

我们希望这项研究能够为国际社会内关于确保先进人工智能为人类利益发展的方式的讨论做出贡献。

阅读我们的论文:https://arxiv.org/abs/2307.04699

Leave a Reply

Your email address will not be published. Required fields are marked *