首页 > 活动线报 > 每日福利 > 如何减少AI“一本正经地胡诌”?新方法出现了

如何减少AI“一本正经地胡诌”?新方法出现了

发布时间:2024-06-25 16:51:54来源: 15210273549

人工智能(AI)中广泛使用的大语言模型不时出现的“一本正经地胡诌”是其难以克服的问题。近日,英国牛津大学研究团队开发出一种名为“语义熵”的新方法,有望大幅提升AI回答的可靠性。

大语言模型的“胡诌”在业界被称为“幻觉”,牛津大学计算机科学系的研究人员提出“语义熵”方法试图解决这一问题。在热力学中,熵描述的是系统的混乱或者说不稳定程度。这项研究中,熵衡量了大语言模型回答的不确定性,不确定性高意味着大语言模型的回答可能存在虚构。

该研究成果已发表在近期出版的英国《自然》杂志上。论文中说,如果AI对同一个问题,给出了许多语义相似的答案,那说明它对自己的回答比较有把握;反之,如果答案五花八门,那就意味着AI自己也“心里没底”,很可能是在“胡诌”。

研究人员利用“语义熵”方法,让大语言模型对同一问题生成多个答案,然后将语义相近的答案聚类,最后根据聚类结果计算熵值。熵值越高,表示大语言模型的回答越不确定。

值得注意的是,这一方法不仅考虑了大语言模型回答的字面差异,更关注语义层面的一致性。这使得“语义熵”能够更准确地识别AI的“胡诌”,而不会被表达方式的多样性所迷惑。

研究结果表明,“语义熵”方法在多个数据集和任务中都表现出色,能有效检测大语言模型的错误回答,并通过拒绝回答不确定的问题来提高整体准确率。更重要的是,这一方法无需修改AI模型本身,可以直接应用于现有的大语言模型。

研究人员说,“语义熵”技术有望在问答系统、文本生成、机器翻译等多个领域发挥重要作用,帮助AI生成更可靠、更有价值的内容。这不仅将提升AI在实际应用中的表现,也将增强用户对AI系统的信任。

每日福利更多>>

消息称一汽丰田总部迁天津,不愿意去的员工最高 N+7 补偿 配新蓝鲸2.0T+爱信8AT,长安CS75 PLUS Ultra 13.19万起售 宁德时代发布磐石底盘 时速120撞击不起火 想买MPV的等等,比亚迪夏即将上市,“冰箱、彩电、大沙发”都有 魏建军:坚守长期主义和底线思维,才能行稳致远 长安汽车荣获碳达峰领跑者企业,科技创变打造“数智新汽车” 看看领克Z20、Model Y、宝马iX1,谁才是Z世代的心头好 问界M8黑色版本曝光!颜值比M9还高,想买理想L8的再等等? 美观野性配置足,最接地气的方盒子吉利牛仔太原上市 网上没赢过,现实没输过——丰田在华60年经历了哪些? 以过度配置打造越级体验,ID.与众重塑15万级纯电SUV“黄金标准” 宁德时代磐石底盘,如何让车企“新车套壳就下线”? 领克版“路虎揽胜”再曝新图,看完颜值,网友:卖40万必爆款 两款澳洲五星安全皮卡大PK:长城山海炮VS全新悍途,谁更强? 小鹏G9全系23.39W起!还看什么小米、特斯拉? 又是一个998 低成本高性能 吉利雷达金刚皮卡能掀桌子吗? 年终岁末大场面,鸿蒙智行四界齐聚央视直播间 秦L降价了!2025年车市价格战酝酿中,但买车有福了? 72小时深度体验MG ES5机会来了!MG ES5“想开了,不试不嫁”试驾启动 下一代G50 3系渲染图!新世代设计语言会是什么样? 15万级的子品牌电车,小鹏Mona M03和萤火虫精品小车怎么选 蔚来李斌:到2035年 全球前十车企至少有一半是中国的 2025年自主或超德系,成豪华车市场最大系别 阿维塔三车系升级AVATR.OS 4.1.4:智能驾驶与车机体验全面提升 比亚迪香港特区新能源车销量破万,海豹车型成新里程碑 长安飞行汽车首飞成功!在重庆“打飞的”,梦想快要照进现实了? 徐长明:双政策拉动150万辆国内消费,汽车出海前景广阔 没有卖不好的车,只有不合适的价格!别克微蓝6已跌破9万? 四大品牌齐发力,2025年长安系多款重磅新车要上 长安汽车豪掷千亿,飞行汽车与人形机器人双翼齐飞!