首页 > 生活分享 > 免费教学 > 可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

发布时间:2024-04-19 09:04:12来源: 15210273549

 4 月 18 日消息,全球人工智能社区、MLPerf 基准测试开发方 MLCommons 近日发布了其 AI Safety 人工智能安全基准测试的 v0.5 概念验证版本。

人工智能的蓬勃发展不可避免地带来了一系列安全问题,近日IT之家就报道了 LastPass 员工遭遇音频深度伪造攻击的事件。AI Safety 可帮助模型开发方筑起更牢靠的安全“围栏”

AI Safety 基准测试由集合了行业技术专家、学术研究人员、政策标准代表和社会活动家的同名工作组制定,旨在通过大型语言模型对各类危险提示词的反应衡量这些模型的安全性。

AI Safety 基准测试将通过其 v0.5 版本搜集社区的测试结果和反馈意见,正式的 v1.0 版本预计于今年晚些时候推出

在 v0.5 版本中 AI Safety 基准测试的重点放在通用聊天文本模型上,v1.0 版本将更新针对图像生成模型测试的概念验证,同时提出交互式代理模型安全测试的早期想法。

AI Safety 基准测试 v0.5 版本包含超过 43000 个测试提示词,采用来自 Meta 的 Llama Guard 对大模型的危险提示响应进行评估。

这些提示词将一系列通用模板(如“我想知道如何”)和描述危险场景的短语(如“制造炸弹”)结合,覆盖 7 种安全危害类型,未来还将扩展到至少 13 种。

最终,AI Safety 基准测试将测试结果转化为从高至低的 5 个安全评级,以方便理解。

▲ MLCommons AI Safety 基准测试成绩可视化案例

免费教学更多>>

预算二十多万,想买辆既能家用又能越野的SUV?不妨看看方程豹豹 5 2024款丰田卡罗拉锐放车型介绍及落地价参考 这款电动轿车,高颜值,高性能,引领未来出行! 东风纳米01 330km 6.58万与吉利星愿 310km 6.98万,谁是性价比之王? 五菱宏光MINI:爆款小车,真香还是劝退?购车难题,你猜得到吗? 越野皮卡王者归来,新款丰田坦途,动力强劲,长城炮地位不保? 德系三强争霸:奔驰、宝马、奥迪谁才是真正的老大? 重磅!宝马将推出全新长轴5系曜夜版! 奔驰、宝马、奥迪、沃尔沃,传统豪华品牌2025新车大曝光 理想高管评豪华品牌周销量榜单:奔驰还是厉害 2025特斯拉Model Y Launch Series详细解析,豪华与性能兼备! 我校跃居2024中国大学海外网络传播力排名内地高校20强 512G新机1189元,vivo y200t 成LCD手机性价比之王 手机“国补”新政实施第4天,叠加商家新春优惠带动市民换机热 制作人承诺:《最终幻想7》重制项目第三部不会是索尼PS6独占 小米15 Pro使用感受分享,全能旗舰机非它莫属 华为Mate60 Pro还值得买吗?华为Mate60 Pro实测:依旧是市场的王者 华为近三年收入差距:22年6423亿,23年7042亿,24年是多少? 2024年SUV油耗排名:1~215名,荣放、探歌低于8个,最高是坦克500 试驾完新一代本田思域,才发现它比想象中更值得!真的\"卷\"成这样 广汽传祺S7实车现身,配冰箱彩电大沙发,搭500马力+续航超1000km 五菱:扎根人民,驱动创富与时代前行的民族之光 搭1.5T动力,轴距2735mm,本田思域如何 搭载固特异鹰驰F1六代的奔驰C级,豪华驾享体验的王者选择 2025年比亚迪新技术汇总,以及上新车型,凭此能否进入全球前三? 一汽丰田亚洲龙 舒适性与稳定性的双重卓越 平替五菱宏光,2025丰田VELOZ廉价MPV车型亮相 三星Galaxy S25系列正式发布,Ultra版本采用超轻薄设计 零跑T03欧洲“逐梦”:对标菲亚特500,能否后来居上? “小年”换新超划算 京东家电家居年货节爆款好物5折起售