首页 > 生活分享 > 免费教学 > 可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

发布时间:2024-04-19 09:04:12来源: 15210273549

 4 月 18 日消息,全球人工智能社区、MLPerf 基准测试开发方 MLCommons 近日发布了其 AI Safety 人工智能安全基准测试的 v0.5 概念验证版本。

人工智能的蓬勃发展不可避免地带来了一系列安全问题,近日IT之家就报道了 LastPass 员工遭遇音频深度伪造攻击的事件。AI Safety 可帮助模型开发方筑起更牢靠的安全“围栏”

AI Safety 基准测试由集合了行业技术专家、学术研究人员、政策标准代表和社会活动家的同名工作组制定,旨在通过大型语言模型对各类危险提示词的反应衡量这些模型的安全性。

AI Safety 基准测试将通过其 v0.5 版本搜集社区的测试结果和反馈意见,正式的 v1.0 版本预计于今年晚些时候推出

在 v0.5 版本中 AI Safety 基准测试的重点放在通用聊天文本模型上,v1.0 版本将更新针对图像生成模型测试的概念验证,同时提出交互式代理模型安全测试的早期想法。

AI Safety 基准测试 v0.5 版本包含超过 43000 个测试提示词,采用来自 Meta 的 Llama Guard 对大模型的危险提示响应进行评估。

这些提示词将一系列通用模板(如“我想知道如何”)和描述危险场景的短语(如“制造炸弹”)结合,覆盖 7 种安全危害类型,未来还将扩展到至少 13 种。

最终,AI Safety 基准测试将测试结果转化为从高至低的 5 个安全评级,以方便理解。

▲ MLCommons AI Safety 基准测试成绩可视化案例

免费教学更多>>

消息称三星与英飞凌及恩智浦达成合作,共同研发下一代汽车芯片解决方案 三星Galaxy S25 Ultra 5G手机12GB+512GB钛银蓝3950元 华硕ROG幻16 Air 2025款发布:Ultra 9-285H+RTX 5070,售价16999元 高效稳定 联想TS90X服务器助力企业基础架构升级 海外用户抱怨索尼 Xperia 1 VII 手机预售订单随机砍单,致赠品 XM5 耳机无法获得 耐尔金红米K70手机壳超薄磁吸全包防摔磨砂保护套 魅族 22 系列手机入网:有望搭载骁龙 8 至尊版、下月发布 靠流量卖爆不存在的!小米SU7交付超25万台 雷军:强大产品力是高销量基础 小米15 Pro 5G手机16GB+512GB白 骁龙8至尊版到手价2236元 奥迪x华为乾崑智驾!豪华电动3.0时代开启 ‏华为MateBook Fold非凡大师开售:新系统和新形态定义智慧PC 华为张平安:机器人“大脑”可在云端操控 东风猛士M817亮相大湾区车展,搭载华为乾崑ADS 4智能驾驶系统 华为公布“一底双长焦”专利,Pura80 Ultra 手机有望搭载 快手14周年,程一笑再次强调“用户第一”与“AI投入” 为何多国老外排队抢购中国货?荣耀400系列海外开售引发抢购热 “荣耀的底色”被掌舵者李健揭开:真实的力量何以成品牌内核 佳能小痰盂三代镜头,天猫立减2200元 红米K80 5G手机16GB+256GB雪岩白仅1224元 小米SU7摘得行业认可“双冠”王 !雷军官宣SU7再获一大奖 玄戒O1成黑马!小米15S Pro杀入5月新机性能榜前五 国产超大杯旗舰开售首月销量排行 小米卖了这么多? 小米YU7价格再造悬念 雷军:23.59万起不可能! 华为 Pura 80 系列外观细节曝光!釉色质感重构科技美学 华为 WATCH 5 拆机惊现 5G 模块 华为智慧屏 S6 开启预售,入门级 MiniLED 电视首选 华为Pura80长焦专利曝光,一底双长焦技术将应用 2025全球手机出货量增长预测下调,华为增速有望领先 曝华为小米OPPO和vivo都在评估测试外挂镜头 OPPO AI走进小学课堂 中国移动“时光阶梯”亮相成都|早报