首页 > 活动线报 > 每日福利 > 如何减少AI“一本正经地胡诌”?新方法出现了

如何减少AI“一本正经地胡诌”?新方法出现了

发布时间:2024-06-25 16:51:54

人工智能(AI)中广泛使用的大语言模型不时出现的“一本正经地胡诌”是其难以克服的问题。近日,英国牛津大学研究团队开发出一种名为“语义熵”的新方法,有望大幅提升AI回答的可靠性。

大语言模型的“胡诌”在业界被称为“幻觉”,牛津大学计算机科学系的研究人员提出“语义熵”方法试图解决这一问题。在热力学中,熵描述的是系统的混乱或者说不稳定程度。这项研究中,熵衡量了大语言模型回答的不确定性,不确定性高意味着大语言模型的回答可能存在虚构。

该研究成果已发表在近期出版的英国《自然》杂志上。论文中说,如果AI对同一个问题,给出了许多语义相似的答案,那说明它对自己的回答比较有把握;反之,如果答案五花八门,那就意味着AI自己也“心里没底”,很可能是在“胡诌”。

研究人员利用“语义熵”方法,让大语言模型对同一问题生成多个答案,然后将语义相近的答案聚类,最后根据聚类结果计算熵值。熵值越高,表示大语言模型的回答越不确定。

值得注意的是,这一方法不仅考虑了大语言模型回答的字面差异,更关注语义层面的一致性。这使得“语义熵”能够更准确地识别AI的“胡诌”,而不会被表达方式的多样性所迷惑。

研究结果表明,“语义熵”方法在多个数据集和任务中都表现出色,能有效检测大语言模型的错误回答,并通过拒绝回答不确定的问题来提高整体准确率。更重要的是,这一方法无需修改AI模型本身,可以直接应用于现有的大语言模型。

研究人员说,“语义熵”技术有望在问答系统、文本生成、机器翻译等多个领域发挥重要作用,帮助AI生成更可靠、更有价值的内容。这不仅将提升AI在实际应用中的表现,也将增强用户对AI系统的信任。

每日福利更多>>

长城汽车×清华大学美术学院 内外兼修方能人车共鸣 霍尼韦尔高性能汽车制冷剂解决方案 东风汽车:以高效、智能、场景化热管理技术赋能新能源汽车体验升级 LG新能源预计Q2营业利润将同比增长152% 德意志银行等将为VinFast提供5.1亿美元私人信贷贷款 传日产汽车计划明年起从中国出口电动汽车 比身份证还小: Intel N50处理器超迷你主板问世 罗马仕、安克召回超120万台充电宝,最新进展公布 奇骏荣誉:嘲讽是看客的事,销量是自己的 搭载华为乾崑智驾+两颗激光雷达 上汽奥迪A5L预售26万起 一文看懂“自主五虎”2025年中考,不轻松、都增长,各得新机遇 合资的品质、接地气的价格,2026款启辰大V限时6.98万起上市 通用汽车上半年销量逾89万辆 同比增长9.4% 百万车主选择汉L:性能与潮改如何兼得? 海外高歌猛进24%,国内苦战存量市场 长城皮卡2025半年报 标配双叉臂+五连杆,预售15.88万起,2026款零跑C11拿去比 “冰箱彩电沙发”,已经不够用了 放暑“价”了!奔腾悦意推出“焕新大大大、购车零零零”政策 2026款起亚赛图斯上市 7.79万起毕业生优惠4千 星纪元ES/ET双双下滑,星途的高端市场很难破局? 开丰田车真的太油腻?你还是太年轻了 “客车之王”宇通,造“百万级豪车”下注高端旅游? 高通发力驾驶辅助下半场,骁龙汽车平台至尊版加速中央计算新时代 法拉利Roma继任者发布,改名后有更迷人吗? \"揭秘!你半年看过的那十款手机,哪一款性价比最高?\" 华为宣布清仓,从3999元跌至2909元,512GB+北斗卫星消息 宝马北美2025上半年销量公布:小幅增长 起亚甩王炸!赛图斯限时7.79万起,座椅通风+辅助驾驶通通给齐 用户反响积极:三星计划为新手机进行重大设计调整 上汽华为“尚界汽车”官号上线 秋季推首款车型