分享缩略图

分享到:
链接已复制
首页> 图 片>

提升人工智能安全水平 “前瞻安全基准”人工智能安全评估框架正式上线

2026-02-28 15:43

来源:中国网

分享到:
链接已复制
字体:

近日,北京前瞻人工智能安全与治理研究院(Beijing-AISI)联合人工智能安全与超级对齐北京市重点实验室、中国科学院自动化研究所人工智能伦理与治理研究中心,提出并发布一套全面、多维的人工智能(AI)安全评估基准体系——“前瞻安全基准”(ForesightSafety Bench),对主流人工智能模型和广泛应用进行全面风险与安全评估。

该基准以AI安全为“第一性原理”指引,以基础安全、拓展安全、产业安全三大类别为支柱,共涵盖7大基础安全风险类别、5大拓展安全支柱以及8大产业安全关键领域,形成了总计94项精细化的风险维度,并已累积形成规模数万条的结构化风险数据与测评结果,全面评估和应对包括智能体安全、具身智能安全、社会智能安全、失控与生存风险等新近安全风险在内的安全隐患,构建了层次化、系统化、覆盖广泛的人工智能安全评估与分析框架。

“前瞻安全基准”人工智能安全评估框架

前瞻人工智能安全基准发布后引起广泛关注。Anthropic联合创始人、OpenAI前政策负责人Jack Clark于2026年2月23日在Important AI(https://jack-clark.net/)上围绕“China’s big AI benchmark”对前瞻安全基准ForesightSafety Bench进行详细分享与点评,他指出“ForesightSafety Bench展现了东西方在AI安全议题上令人惊讶的共识”。Jack Clark还强调了此项研究的重要意义,“AI政策存在一些共通工具:可测量性是大多数AI治理形式的基本前提。尽管地缘政治层面存在分歧,但各国的AI科学家都在面对共同的课题——如何从社会相关层面评估其系统的属性。而更令人鼓舞的是,中国的研究者也在为那些美国前沿实验室同样担忧的生存性风险问题而思考与努力。”

该框架将持续迭代,为人工智能的安全发展提供系统性指引,助力人工智能技术与系统安全发展,行稳致远。


“前瞻安全基准”排行榜及模型系统安全卡可在以下链接获取:

网站链接:

https://foresightsafety-bench.beijing-aisi.ac.cn/

GitHub链接:

https://github.com/Beijing-AISI/ForesightSafety-Bench

论文链接:

https://arxiv.org/pdf/2602.14135

【责任编辑:伦晓璇】
返回顶部