首页 > 生活分享 > 免费教学 > 可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

发布时间:2024-04-19 09:04:12来源: 15210273549

 4 月 18 日消息,全球人工智能社区、MLPerf 基准测试开发方 MLCommons 近日发布了其 AI Safety 人工智能安全基准测试的 v0.5 概念验证版本。

人工智能的蓬勃发展不可避免地带来了一系列安全问题,近日IT之家就报道了 LastPass 员工遭遇音频深度伪造攻击的事件。AI Safety 可帮助模型开发方筑起更牢靠的安全“围栏”

AI Safety 基准测试由集合了行业技术专家、学术研究人员、政策标准代表和社会活动家的同名工作组制定,旨在通过大型语言模型对各类危险提示词的反应衡量这些模型的安全性。

AI Safety 基准测试将通过其 v0.5 版本搜集社区的测试结果和反馈意见,正式的 v1.0 版本预计于今年晚些时候推出

在 v0.5 版本中 AI Safety 基准测试的重点放在通用聊天文本模型上,v1.0 版本将更新针对图像生成模型测试的概念验证,同时提出交互式代理模型安全测试的早期想法。

AI Safety 基准测试 v0.5 版本包含超过 43000 个测试提示词,采用来自 Meta 的 Llama Guard 对大模型的危险提示响应进行评估。

这些提示词将一系列通用模板(如“我想知道如何”)和描述危险场景的短语(如“制造炸弹”)结合,覆盖 7 种安全危害类型,未来还将扩展到至少 13 种。

最终,AI Safety 基准测试将测试结果转化为从高至低的 5 个安全评级,以方便理解。

▲ MLCommons AI Safety 基准测试成绩可视化案例

免费教学更多>>

极氪携手特来电等国网企业,共建800V超快充网络,充电布局再升级! 雷军试驾小米SU7 Ultra跑山,网友齐赞帅气,预售81.49万值不值? 高德地图联手蔚来ET9推出全域车道级导航服务 OpenAI GPT-5研发遇挑战,成本高,性能提升不及预期 智界R7增程版亮相上海外滩,用车点亮巨型圣诞树是什么体验? 悦达起亚社会责任报告斩获“五星佳”殊荣 等等再出手 12月还有多款新车来袭 2025款腾势D9领衔 新款奔驰C级有望2025年一季度首发,配三叉星光源,竞争新奥迪A5L 2026款现代帕里斯帝亮相!2.5T混动,动力强油耗低,轴距加长50mm 蔚来全新品牌萤火虫首车亮相:独树一帜“三眼灯” 插混SUV市场变天了!星舰7上市13天交付破万台,吉利开窍了? 白色实车首次亮相!英菲尼迪QX80豪华大七座越野车来啦 复古小资情调,本田S10T电动车4099元上市,性能如何? 蔚来萤火虫品牌电池包合作宁德时代,目标3万座换电站建设 蔚来天行底盘有多强 ET9车头摆放六层香槟塔稳稳通过减速带 美国NHTSA提案:自动驾驶汽车透明度提升,加速商业化部署 大陆集团计划2025年完成汽车业务IPO;森萨塔科技换帅 全新外观+Lion 5.0 AI座舱 瑞虎5x高能版将于12月23日上市 吉利雷达金刚,纯电动皮卡新品 1~5线城市消费者都爱买哪些车?比亚迪通吃,特斯拉取代BBA 理想汽车再下探,平替们要加油喽! 11月紧凑型SUV销量“卖爆了” 20款销量过万 星越L第三 小鹏飞行汽车最大的对手来了!韩国正式引入eVTOL飞行出租车! 汽车行业电动化转型和智能化进程,谁也逃不过转型的“真香定律” “新汽车 新生态”为主题,5年撬动200亿,长安汽车低空经济动力拉满 搭第五代DM技术 新款腾势D9于12月26日上市 广汽丰田凯美瑞光辉版上市:磨砂灰车身+丹拿音响 中英科技终止收购博特蒙,跨界新能源汽车战略受挫 车企供应链边界模糊,智能化推动行业新变革 华为智界R7增程版发布,售价低于纯电版1万元