首页 > 生活分享 > 免费教学 > 谷歌Deepmind、斯坦福大学研究人员推出AI事实核查工具

谷歌Deepmind、斯坦福大学研究人员推出AI事实核查工具

发布时间:2024-03-31 20:20:01来源: 15210273549

 3 月 31 日消息,无论当下 AI 聊天机器人有多么强大,都会或多或少存在一大饱受诟病的行为 —— 以看上去令人信服的方式,向用户提供与事实不符的回答。简单来说,AI 有时会在回答中“满口跑火车”,甚至“造谣”。

图源 Pixabay

防止 AI 大模型出现这种行为并非易事,且是一项技术性的挑战。不过据外媒 Marktechpost 报道,谷歌 DeepMind 和斯坦福大学似乎找到了某种变通办法。

研究人员推出了一种基于大语言模型的工具 —— 搜索增强事实评估器(IT之家注:原名为 Search-Augmented Factuality Evaluator,简称 SAFE),可对聊天机器人生成的长回复进行事实核查。其研究结果与实验代码、数据集现已公布,点此查看

该系统可通过四个步骤对聊天机器人生成的回复进行分析、处理和评估,以验证准确性和真实性:将答案分割成单个待核查内容、对上述内容进行修正、再与谷歌搜索结果进行比较。随后,该系统还会检查各个事实与原始问题的相关性。

为评估其性能,研究人员创建了包含约 16000 个事实的数据集 LongFact,并在来自 Claude、Gemini、GPT、PaLM-2 的 13 个大语言模型上测试了该系统。结果显示,在对 100 个有争议的事实进行的重点分析中,SAFE 的判定在进一步审查下正确率达到 76% 。与此同时,该框架还具备经济性优势:成本比人工注释便宜 20 多倍

免费教学更多>>

iOS 18.5正式版两大亮点:发热解决、电池查清,更新体验超预期 苹果iOS 18.5正式版发布,带来多项新功能和错误性修复 谷歌将为安卓16引入90:10分屏模式 以提升移动设备多任务处理效率 全面搭载鸿蒙 5?华为nova 14系列将带来全新的鸿蒙AI体验 热搜!华为发布鸿蒙电脑新品预热海报 红魔电竞小平板即将发布 预计搭载骁龙8至尊版并内置散热风扇 华为发布会将推出鸿蒙折叠电脑,新品价格可能相对较高 华为不仅要做鸿蒙电脑 还要做可折叠鸿蒙电脑? 体验三星Galaxy S25 Edge 超轻薄旗舰风潮由此开启 三星炫技:Polygon Foldable概念折叠手机亮相,金属质感 AI驱动下的异构智能云架构,上海交大与联想产学研模式新突破 科技赋能物流!陇西:无人驾驶快递车投运 日均派件效率提升30% AI“押题”成备考“神器”?考前冲刺路,千万别走歪 AI在义乌,让小生意玩转大世界 3张照片→全景3D:苹果携手推出革命性AI模型Matrix3D Vivo 或许将凭借全新 S30 系列双雄解决其中端手机面临的最大抱怨 荣耀平板10新品即将上市,号称“解放家长的平板新物种” 荣耀内部进行“重新竞聘上岗”,新增AI新产业部门 一加平板2 Pro发布:骁龙8至尊版,国补后2719.15元起 TCL T7L Pro 75英寸实拍:蝶翼星曜屏 + 万象分区,旗舰配置下放 魅族 Note 16 系列价格公布:中端市场的“技术堆料”与定价阳谋 魅族21Note开箱上手!白面板,大屏幕,长续航,我全都要! 魅族Note 16系列发布,首销799元起,产品配置、价格一文汇总 真人人都买得起!魅族Note 16系列正式发布,产品配置和竞争力简析 魅族预热水月雨联名PANDAER“PILL音乐胶囊”耳夹式耳机 真我GT Neo7半年深度测评:优缺点大揭秘 iQOO Neo10 Pro+ 登场在即:创新设计融合多重顶尖配置 曝华为nova 14系列手机本月见 OPPO Reno14全面解析:颜值党的终极武器还是高价花瓶? 预算2000元怎么选?学生高性价比平板Top4,性能/续航/生态全解析