首页 > 生活分享 > 免费教学 > 谷歌DeepMind优化AI模型新思路,计算效率与推理能力兼得

谷歌DeepMind优化AI模型新思路,计算效率与推理能力兼得

发布时间:2024-12-28 22:47:23来源: 13041198719
 12 月 28 日消息,谷歌 DeepMind 团队最新推出了“可微缓存增强”(Differentiable Cache Augmentation)的新方法,在不明显额外增加计算负担的情况下,可以显著提升大语言模型的推理性能。
 
项目背景
IT之家注:在语言处理、数学和推理领域,大型语言模型(LLMs)是解决复杂问题不可或缺的一部分。
 
计算技术的增强侧重于使 LLMs 能够更有效地处理数据,生成更准确且与上下文相关的响应,随着这些模型变得复杂,研究人员努力开发在固定计算预算内运行而不牺牲性能的方法。
 
优化 LLMs 的一大挑战是它们无法有效地跨多个任务进行推理或执行超出预训练架构的计算。
 
当前提高模型性能的方法涉及在任务处理期间生成中间步骤,但代价是增加延迟和计算效率低下。这种限制阻碍了他们执行复杂推理任务的能力,特别是那些需要更长的依赖关系或更高地预测准确性的任务。
 
项目介绍
“可微缓存增强”(Differentiable Cache Augmentation)采用一个经过训练的协处理器,通过潜在嵌入来增强 LLM 的键值(kv)缓存,丰富模型的内部记忆,关键在于保持基础 LLM 冻结,同时训练异步运行的协处理器。
 
 
 
整个流程分为 3 个阶段,冻结的 LLM 从输入序列生成 kv 缓存;协处理器使用可训练软令牌处理 kv 缓存,生成潜在嵌入;增强的 kv 缓存反馈到 LLM,生成更丰富的输出。
 
 
 
在 Gemma-2 2B 模型上进行测试,该方法在多个基准测试中取得了显著成果。例如,在 GSM8K 数据集上,准确率提高了 10.05%;在 MMLU 上,性能提升了 4.70%。此外,该方法还降低了模型在多个标记位置的困惑度。
 
 
 
谷歌 DeepMind 的这项研究为增强 LLMs 的推理能力提供了新的思路。通过引入外部协处理器增强 kv 缓存,研究人员在保持计算效率的同时显著提高了模型性能,为 LLMs 处理更复杂的任务铺平了道路。

免费教学更多>>

预算二十多万,想买辆既能家用又能越野的SUV?不妨看看方程豹豹 5 2024款丰田卡罗拉锐放车型介绍及落地价参考 这款电动轿车,高颜值,高性能,引领未来出行! 东风纳米01 330km 6.58万与吉利星愿 310km 6.98万,谁是性价比之王? 五菱宏光MINI:爆款小车,真香还是劝退?购车难题,你猜得到吗? 越野皮卡王者归来,新款丰田坦途,动力强劲,长城炮地位不保? 德系三强争霸:奔驰、宝马、奥迪谁才是真正的老大? 重磅!宝马将推出全新长轴5系曜夜版! 奔驰、宝马、奥迪、沃尔沃,传统豪华品牌2025新车大曝光 理想高管评豪华品牌周销量榜单:奔驰还是厉害 2025特斯拉Model Y Launch Series详细解析,豪华与性能兼备! 我校跃居2024中国大学海外网络传播力排名内地高校20强 512G新机1189元,vivo y200t 成LCD手机性价比之王 手机“国补”新政实施第4天,叠加商家新春优惠带动市民换机热 制作人承诺:《最终幻想7》重制项目第三部不会是索尼PS6独占 小米15 Pro使用感受分享,全能旗舰机非它莫属 华为Mate60 Pro还值得买吗?华为Mate60 Pro实测:依旧是市场的王者 华为近三年收入差距:22年6423亿,23年7042亿,24年是多少? 2024年SUV油耗排名:1~215名,荣放、探歌低于8个,最高是坦克500 试驾完新一代本田思域,才发现它比想象中更值得!真的\"卷\"成这样 广汽传祺S7实车现身,配冰箱彩电大沙发,搭500马力+续航超1000km 五菱:扎根人民,驱动创富与时代前行的民族之光 搭1.5T动力,轴距2735mm,本田思域如何 搭载固特异鹰驰F1六代的奔驰C级,豪华驾享体验的王者选择 2025年比亚迪新技术汇总,以及上新车型,凭此能否进入全球前三? 一汽丰田亚洲龙 舒适性与稳定性的双重卓越 平替五菱宏光,2025丰田VELOZ廉价MPV车型亮相 三星Galaxy S25系列正式发布,Ultra版本采用超轻薄设计 零跑T03欧洲“逐梦”:对标菲亚特500,能否后来居上? “小年”换新超划算 京东家电家居年货节爆款好物5折起售