首页 > 活动线报 > 每日福利 > 如何减少AI“一本正经地胡诌”?新方法出现了

如何减少AI“一本正经地胡诌”?新方法出现了

发布时间:2024-06-25 16:51:54来源: 15210273549

人工智能(AI)中广泛使用的大语言模型不时出现的“一本正经地胡诌”是其难以克服的问题。近日,英国牛津大学研究团队开发出一种名为“语义熵”的新方法,有望大幅提升AI回答的可靠性。

大语言模型的“胡诌”在业界被称为“幻觉”,牛津大学计算机科学系的研究人员提出“语义熵”方法试图解决这一问题。在热力学中,熵描述的是系统的混乱或者说不稳定程度。这项研究中,熵衡量了大语言模型回答的不确定性,不确定性高意味着大语言模型的回答可能存在虚构。

该研究成果已发表在近期出版的英国《自然》杂志上。论文中说,如果AI对同一个问题,给出了许多语义相似的答案,那说明它对自己的回答比较有把握;反之,如果答案五花八门,那就意味着AI自己也“心里没底”,很可能是在“胡诌”。

研究人员利用“语义熵”方法,让大语言模型对同一问题生成多个答案,然后将语义相近的答案聚类,最后根据聚类结果计算熵值。熵值越高,表示大语言模型的回答越不确定。

值得注意的是,这一方法不仅考虑了大语言模型回答的字面差异,更关注语义层面的一致性。这使得“语义熵”能够更准确地识别AI的“胡诌”,而不会被表达方式的多样性所迷惑。

研究结果表明,“语义熵”方法在多个数据集和任务中都表现出色,能有效检测大语言模型的错误回答,并通过拒绝回答不确定的问题来提高整体准确率。更重要的是,这一方法无需修改AI模型本身,可以直接应用于现有的大语言模型。

研究人员说,“语义熵”技术有望在问答系统、文本生成、机器翻译等多个领域发挥重要作用,帮助AI生成更可靠、更有价值的内容。这不仅将提升AI在实际应用中的表现,也将增强用户对AI系统的信任。

每日福利更多>>

推荐尊荣型 2025款腾势N9购车指南 2025款小鹏G6新车商品性评价 2.0T性能钢炮一口价11.98万!福特锐际卷出合资SUV新高度 实话实说:黄毛开SU7?只管加速快,不管生与死! 2025年清远市招聘事业编制高层次人才公告(6人) 2025年广东省连州市赴高校设点面向社会招聘编制教师公告(37人) 2025年珠海高新区科技产业局招聘合同制职员公告(2人) 2025年广州市白云区康园工疗站服务中心补录工疗站实务岗工作人员公告(2人) 2025年河北农业大学选聘工作人员公告 “运动轿跑007”三剑客对决,MG7凭借实力脱颖而出 上汽大众与上海置换“市补”完美叠加,外牌车主换新车就是现在! 尊界S800内饰首曝,以登峰造极的精致工艺,构建超豪新范式 一汽奥迪A5L大量信息曝光!不仅有华为智驾,还有彩电、大沙发 广汽本田P7用了什么黑科技,能从7大挑战中战胜Model Y? 坚持做自己 就是揽胜汽车豪华品牌的底气 这个星球上最炸的车展本周开幕,错过这些新车别后悔! 起价17.28万!2025款星纪元ET:改写增程SUV市场格局? 春节后国产手机好戏连台,小米15 Ultra杀到,OPPO出超薄折叠旗舰 微软开源140亿参数小语言AI模型Phi-4,性能比肩GPT-4o Mini 消息称一汽丰田总部迁天津,不愿意去的员工最高 N+7 补偿 配新蓝鲸2.0T+爱信8AT,长安CS75 PLUS Ultra 13.19万起售 宁德时代发布磐石底盘 时速120撞击不起火 想买MPV的等等,比亚迪夏即将上市,“冰箱、彩电、大沙发”都有 魏建军:坚守长期主义和底线思维,才能行稳致远 长安汽车荣获碳达峰领跑者企业,科技创变打造“数智新汽车” 看看领克Z20、Model Y、宝马iX1,谁才是Z世代的心头好 问界M8黑色版本曝光!颜值比M9还高,想买理想L8的再等等? 美观野性配置足,最接地气的方盒子吉利牛仔太原上市 网上没赢过,现实没输过——丰田在华60年经历了哪些? 以过度配置打造越级体验,ID.与众重塑15万级纯电SUV“黄金标准”