曾毅_ 从布莱切利、首尔到巴黎：亲历三届人工智能峰会启示录

首页 > 案例

发布时间：2025-03-20

【文/观察者网专栏作者曾毅】

人工智能进展对人类社会变革发挥着深刻的作用，近期在应用与服务方面给予公众的感受更是达到了前所未有的高度。而人工智能对人类可能造成的潜在安全风险，也从两百多年前玛丽·雪莱《弗兰肯斯坦》中的隐喻和阿西莫夫《我、机器人》中的叙事，迅速进入公众与政府的视野。

2015年，在波多黎各召开了人工智能安全科技领域的前沿会议。而人工智能安全作为需要国际协作解决的全球挑战，真正进入公众与政府视野，还是回到雪莱的故乡英国，图灵机与二战期间恩尼格玛密码机的诞生地布莱切利园。

2023年11月在英国举行的首届人工智能安全峰会(AI Safety Summit)，最重要的成果当属《布莱切利人工智能安全宣言(The Bletchley Declaration on AI Safety)》，28国及欧盟在人工智能安全风险认知与议题上达到当时政府层面最广泛的共识。

这项共识的取得背后是与各国政府和科技界长达半年多的沟通，才推进了这个极具不确定性的议题上取得共同认知。

英美相继宣布人工智能安全研究所的成立影响广泛，但这使得许多国家的代表迷茫于不知如何选边站，可又何须选边？

曾毅_ 从布莱切利、首尔到巴黎：亲历三届人工智能峰会启示录

我受邀主持了圆桌会议“前沿人工智能不可预知进展带来的风险”的研讨，并在公开全体会议的总结环节，有机会直面这个问题进行了发言：“我们认为每个国家都应该成立自己的人工智能安全机构。但这还不够，我们还需要建立一个涵盖全世界的人工智能安全协作网络，以期能够解决不可预知的进展和不可预知的失败。另外，这次会议我们有28国参加，我们希望能够进一步提升会议的包容性，下届能够有40国，再下届也许可以是60国”。

会后过去一年多的时间，我们看到至少十余个国家成立了人工智能安全专门的机构，韩国首尔人工智能峰会上实际已经成立了国际人工智能安全研究所网络(International Network of AISI)，却将中国排除在外。而这个会议系列的包容性在首尔峰会并没有增加，直至巴黎人工智能行动峰会，正式参与的国家达到了80国以上。

2023年在布莱切利人工智能安全峰会(AI Safety Summit)公开会议主会环节发言，笔者建议成立面向国家间合作的国际人工智能安全网络

2023年在布莱切利人工智能安全峰会(AI Safety Summit)主持“前沿人工智能不可预知进展带来的风险”圆桌研讨

2024年5月人工智能首尔峰会(AI Seoul Summit)虽然由韩国与英国共同主办，但是峰会的标题中，安全已没有作为核心。但这届会议仍然取得了引人瞩目的进展，主要是宣布国际人工智能安全研究所网络的成立和面向企业的人工智能安全自愿承诺(Frontier AI Safety Commitments)。

布莱切利峰会半年内，全球人工智能安全相关机构已经逐步浮出水面，人工智能安全协作网络的提议已成为共识，人工智能安全研究所网络(Network of AISI)应运而生，然而却是在更小范围的10个国家和欧盟参与的情况下形成的决议，没有任何合理的理由，中国被排除在外。

在人工智能首尔峰会部长论坛(Ministers’ Session)上，我听到时任英国科技、创新与技术部部长对这个情况的介绍后感到完全不可接受，并在安排的学者代表发言环节进行了回应：“国家层面人工智能安全制度的建设每个国家都有不同的选择，建立单一国家级人工智能安全研究所的国家，目前已然需要面对如何解决国内人工智能安全相关机构之间竞争与协同的问题。

中国与不同部委协同的人工智能安全机构众多，更适合中国的人工智能安全相关机构组织模式是国家层面的协作网络，机构之间的互联与协作甚至可以在国家层面的人工智能安全机制复合体的协调方面发挥积极作用。

国际人工智能安全网络的概念提出甚至有来自中国的贡献，而中国被排除在这个网络之外，这不仅是不可接受的，更是自布莱切利会议努力之后历史的倒退”。

首尔会议之后，国内相关单位继续协同推进，“中国人工智能发展与安全研究网络(China AI Development and Safety Network)”在2024年9月联合国大会期间，由中国和赞比亚共同作为主办国发起的人工智能能力建设国际合作高级别会议(High-level Meeting on International Cooperation on Capacity-building of Artificial Intelligence)上，我作为学者代表首次对外宣布，会议在联合国纽约总部举行。

人工智能首尔峰会(AI Seoul Summit)部长论坛(Ministers’ Session)，笔者作为学者代表发言，介绍为应对安全治理机制复合体的发展现状，中国正在探索以国家层面人工智能安全网络的形式形成政产学研协作机制

“中国人工智能发展与安全研究网络”在2024年9月联合国大会期间，由中国、赞比亚主办人工智能能力建设国际合作高级别会议上宣介

首尔峰会的另外一项重要成果是面向企业的“前沿人工智能安全承诺(Frontier AI Safety Commitments)”，这项承诺集结了来自多国处于最前沿人工智能模型研发的代表性企业。一年来，英国在承诺参与的企业方面持续发力，至今得到包括中国3家代表性企业，全球共20家领先企业的支持。

自愿承诺是企业自律自治的行为，制定并公开安全护栏与框架是人工智能企业推进人工智能安全落地重要的实践。

与此项工作以及白宫推进的人工智能企业自愿承诺相关的，来自中国人工智能产业的集体表态，则是中国人工智能产业联盟(AIIA)发起的“人工智能安全承诺”，首批得到17家中国领先人工智能企业的支持。

2025年2月于法国巴黎召开的人工智能行动峰会(Paris AI Action Summit)，在这个系列会议中得到了更高的关注和更多国家的支持，这首先得益于在国家参与方面更高的包容性，使得巴黎峰会最终聚集了80国领导人与超过100个国家的各界代表的参与。

可以理解的是，法国召开人工智能的旗舰会议希望全面推进人工智能的科学、应用、文化、治理等诸多方面的进展，但人工智能政产学研领域已有诸多综合性的国际会议。而相比其他会议，从布莱切利开始的人工智能峰会系列的最大价值，正是会议聚焦人工智能安全与风险。

虽然在此届峰会名称上没有明确体现安全，但是若考虑法国倡导推进“行动(Action)”作为焦点，却不能得到这届会议完全忽视安全与风险议题的结论。

事实是，人工智能行动峰会主会公开日的议程有诸多相关议题，包括但不限于”隐私、网络安全与信息完整性： “利用人工智能保护民主制度”、“加强高效、有效且包容的全球人工智能治理”、“构建可信人工智能：从自愿承诺到协作实践准则”、“迈向安全可信的人工智能：企业承诺”、“迈向安全可信的人工智能：欧盟协作实践准则”、“人工智能的国际治理”、“为网络和人工智能安全构建开源未来”等主会场议题和峰会正式专题研讨会，覆盖峰会当天1/3议题。

可也不能说本届峰会在人工智能安全方面是成果丰硕的，毕竟在安全方面的实际产出没有像《布莱切利宣言》、《前沿人工智能安全承诺》这样的代表性工作。

人工智能行动峰会主会日，与法国总统人工智能行动峰会特使Anne女士合影，她2024年底访问北京并邀请中国政产学研各方代表参加行动峰会。

人工智能行动峰会科学日举办“人工智能、科学与社会(AI, Science and Society)”大会，集结了法国人工智能科技与政策最富盛名的相关单位共同组织，由法国巴黎理工学院、法国科学院、法国国家信息与自动化研究院、巴黎高等商学院领衔，是在科学层面推进人工智能行动本届大会最值得关注的。

会议专门组织了人工智能安全科学(Science of AI Safety and Security)议题的若干研讨环节，主要包括“前沿人工智能安全阈值”、“国际人工智能安全报告”、“可信人工智能国际标准”三个主要研讨。

严格意义上虽然不能算是法国人工智能行动峰会的主要成果，但是“国际人工智能安全报告(International Report on AI Safety)”借助人工智能行动峰会科学日，确实赢得了更多关注。

该报告由英国人工智能安全研究所主导，邀请包含中国在内的30个国家学者和机构参加，曾于人工智能首尔峰会（AI Seoul Summit）发布中期报告。我有幸作为报告中代表中国的专家指导委员会委员，参与该报告的全过程。

在峰会科学日的人工智能安全科学研讨环节，大会邀请了报告主席Yoshua Bengio对报告进行介绍，并邀请了来自美、中、法的代表共论人工智能安全的未来。

《国际人工智能安全报告》的科学贡献Yoshua Bengio做了详细的介绍，百位学者参与的科学报告至少在人工智能领域是一个壮举。我被主持人问及，我们的报告中哪个风险是最重要的或者最具威胁的。我的回应是：“首先，这如同全球可持续发展目标的17个目标，其中一个失败了，可持续发展目标就是失败了，社会都没有实现可持续。其次，前沿人工智能模型目前具备认知功能自动升级和演化的能力，这意味着对人工智能风险的分级将很难真正控制风险的实际等级，因为风险及其类型将随自主认知升级失去确定性”。

BB贝博艾弗森官方网站

此外我还谈到与《国际人工智能安全报告》一项互补的研究，即由我在中国科学院自动化研究所和人工智能安全与超级对齐北京市重点实验室的团队等单位协作共同发布的《全球人工智能安全指数(Global Index on AI Safety)》报告。

与《国际人工智能安全报告》的互补在于《全球人工智能安全指数》以国家为单位，给出了40个国家在人工智能安全就绪度的现状，美、英、中三国名列前茅。

有些学者联系我们说，报告似乎反映出国家的人工智能安全就绪度，整体而言与国家的经济水平似乎密切相关。我回复说这正是我们要提醒各个国家的。人工智能的发展水平可能由于各国经济水平的差异有显著差异，但是人工智能安全就绪度事关人工智能是否能够在相关国家稳健的部署与应用，事关对该国可能造成的不可预知的潜在风险的应对。因此即使这些国家在发展方面尚需积累，但是也要在人工智能安全就绪度方面尽快做好更充分的准备。

在回顾《国际人工智能安全报告》形成的过程中的点滴时，我还讲了一个很有意义的互动。当我在顾问专家委员会的会议上指出，目前的报告主要聚焦在大语言模型的风险，而对于人工智能规则推理、自然与脑启发的人工智能等不同的人工智能发展科学途径存在的潜在风险没有涉及的时候，Yoshua Bengio指出这也许也是他自己研究上的一种偏向的体现。

作为综合性的科学报告，这个理由显然没有说服我；然而最终报告明确聚焦在“通用人工智能(General-Purpose AI)”的风险上，却让我觉得至少更清晰了。

其他途径发展的人工智能模型目前尚未具备显著的“通用人工智能(General-Purpose AI)”特征，在这个阶段，可控性方面的风险上确实也应当更聚焦在“前沿通用人工智能模型”。

在巴黎峰会期间形成的《包容与可持续的人工智能造福人类与地球的声明》也没有完全回避安全议题。例如在主要优先议题共识中提到：“确保人工智能开放、包容、透明、符合伦理、安全可靠且值得信赖”，“加强国际合作，以促进国际治理的协调”。

又提及“利用人工智能技术的益处来支持我们的经济和社会取决于推进信任和安全”，并赞扬了英国和韩国峰会在安全方面取得的进展。

而本次《声明》中更值得肯定的是对人工智能推进可持续发展、联合国在人工智能全球治理中发挥的作用与对相关进程的认可、特别是提及人工智能的发展对全球能源的影响，以及提议“与国际能源署合作建立人工智能能源影响观测站”。

随着人工智能的发展与应用，以及对可持续发展的积极与负面影响，这项提议及其落实将对人类与环境有非凡的意义。

非常值得单独提的是愿景中提到“人类与地球”，这不是单纯的以人类为中心的愿景，而是充分考虑人工智能赋能人类生存与发展的同时将人类、生态与地球作为整体共同繁荣、共同发展。因此《声明》得到了60余国以及非盟和欧盟的正式支持。

虽然《声明》提及的诸多理念与共识在2024年的两项联合国大会决议《抓住安全、可靠和值得信赖的人工智能系统带来的机遇，促进可持续发展》、以及《加强人工智能能力建设国际合作》和联合国《全球数字契约》中都有体现，但是来自60余国的再次明确支持与进一步的相关行动，仍然能够为以联合国为核心的国际人工智能科技合作与治理提供有益的支持。

人工智能行动峰会边会“AI Safety Connect 2025”人工智能安全研究机构圆桌研讨

由法国亚洲学会与亚洲人工智能安全举办的“From Oil to Water: Governing AI as a Global Public Good”

与英国和首尔峰会最大的不同是，巴黎峰会其实是峰会周(Summit Week)，围绕人工智能诸多议题极为丰富的边会也是峰会周的亮点。在峰会主会上没有机会展开的议题、没有能够形成的交流都在通过边会以不同形式推进。

我主要参与并作为研讨嘉宾发言的公开活动，主要包括由阿联酋穆罕默德・本・拉希德政府学院和生命未来研究所主办的“AI Safety Connect 2025”，以及由法国亚洲学会与亚洲人工智能安全举办的“From Oil to Water: Governing AI as a Global Public Good”等。

这些活动都在促成不同国家的人工智能安全研究所之间的潜在合作发挥作用。几位来自不同国家人工智能安全相关研究机构的发言人拥有的共识便是：只有来自不同国家的人工智能安全机构能够开展更广泛的联合测试，才能够真正意义共护安全，共享发展。

此外，中国人工智能发展与安全网络、中法人工智能协会等都组织了峰会的公开边会，为促进中国人工智能的国际合作与交流以不同形式发挥积极作用。

回顾英国、韩国、法国三届人工智能峰会，可以看到在每届由一国主导的峰会上坚持统一的议题巨大的挑战。倘若三届峰会能够持之以恒地坚持人工智能安全议题，那么这个系列峰会的意义和影响将是巨大的。

然而主办国从不同视角出发的考量也确实难以视而不见，这导致了人工智能安全与风险管控议题难以如会议系列开始阶段的高效推进。

加之近期美国人工智能安全管控政策方面的不确定性，以及英国人工智能安全研究所更名等一系列相关影响，急需稳定并推进国际人工智能安全协作。

来自政产学研围绕人工智能安全的各方努力，需要转化为一个持久、包容且由社区驱动的人工智能安全进程(AI Safety Process)。该进程应具有灵活性，能兼顾不同观点，确保各国在不同时期推进人工智能安全工作的连贯性、协调性和可扩展性。

人工智能安全进程应造福全人类，而不应由任何一个国家或组织独占。它需要所有利益相关方跨越时空，在一个协调的框架内持续共同努力，得到学术界、产业界、公民社会、各国政府、政府间组织等各方的参与、推动和支持。

可持续地推进全球关键议题，联合国仍然是最合适的平台，因此应当支持联合国发挥核心作用，但这并不意味着需要在联合国框架下开展所有的工作。

联合国发挥的作用是激发各个层面的协作和伙伴，将成员国、其他政府间组织、机构的努力汇聚成高度交织并深刻互联的网络，聚流成河，汇江成海。三届峰会中，法国峰会从会议内容和《声明》给予了联合国更多的认同，这是值得赞赏的。

另一方面，三届峰会期间人工智能安全方面的产出，以及韩国、法国峰会期间在人工智能赋能可持续发展方面的产出，都与联合国框架下开展的工作形成互补的贡献，联合国与成员国及峰会主办国之间需要更积极地将这些互补的努力化为全球贡献，以通过人工智能稳健、安全与可持续的发展推进人类与生态共生的未来为目标，以不使任何一个国家，不使任何一个人掉队为使命。

本文系观察者网独家稿件，文章内容纯属作者个人观点，不代表平台观点，未经授权，不得转载，否则将追究法律责任。关注观察者网微信guanchacn，每日阅读趣味文章。

汇聚最新资讯 / 产品信息 用最专业的眼光看待互联网 立即咨询

汇聚最新资讯 / 产品信息
用最专业的眼光看待互联网
立即咨询