首页 > 生活分享 > 免费教学 > 谷歌DeepMind优化AI模型新思路,计算效率与推理能力兼得

谷歌DeepMind优化AI模型新思路,计算效率与推理能力兼得

发布时间:2024-12-28 22:47:23
 12 月 28 日消息,谷歌 DeepMind 团队最新推出了“可微缓存增强”(Differentiable Cache Augmentation)的新方法,在不明显额外增加计算负担的情况下,可以显著提升大语言模型的推理性能。
 
项目背景
IT之家注:在语言处理、数学和推理领域,大型语言模型(LLMs)是解决复杂问题不可或缺的一部分。
 
计算技术的增强侧重于使 LLMs 能够更有效地处理数据,生成更准确且与上下文相关的响应,随着这些模型变得复杂,研究人员努力开发在固定计算预算内运行而不牺牲性能的方法。
 
优化 LLMs 的一大挑战是它们无法有效地跨多个任务进行推理或执行超出预训练架构的计算。
 
当前提高模型性能的方法涉及在任务处理期间生成中间步骤,但代价是增加延迟和计算效率低下。这种限制阻碍了他们执行复杂推理任务的能力,特别是那些需要更长的依赖关系或更高地预测准确性的任务。
 
项目介绍
“可微缓存增强”(Differentiable Cache Augmentation)采用一个经过训练的协处理器,通过潜在嵌入来增强 LLM 的键值(kv)缓存,丰富模型的内部记忆,关键在于保持基础 LLM 冻结,同时训练异步运行的协处理器。
 
 
 
整个流程分为 3 个阶段,冻结的 LLM 从输入序列生成 kv 缓存;协处理器使用可训练软令牌处理 kv 缓存,生成潜在嵌入;增强的 kv 缓存反馈到 LLM,生成更丰富的输出。
 
 
 
在 Gemma-2 2B 模型上进行测试,该方法在多个基准测试中取得了显著成果。例如,在 GSM8K 数据集上,准确率提高了 10.05%;在 MMLU 上,性能提升了 4.70%。此外,该方法还降低了模型在多个标记位置的困惑度。
 
 
 
谷歌 DeepMind 的这项研究为增强 LLMs 的推理能力提供了新的思路。通过引入外部协处理器增强 kv 缓存,研究人员在保持计算效率的同时显著提高了模型性能,为 LLMs 处理更复杂的任务铺平了道路。

免费教学更多>>

字节开源其AI IDE工具核心组件Trae-Agent 特斯拉Model 3获2025 Euro NCAP最高分359分,成欧洲最安全新车 100%车规级零部件:第七代Robotaxi车型亮相国际交通展,基于极狐阿尔法T5打造 为什么手表显示的“心率”很离谱?因为它根本没测心跳 零跑险胜问界,新势力车企6月销量均向好? 基于SPA3平台打造/专供欧洲市场 Polestar 7预告图发布 两个月内三款新车入市,长安引力加速“抢市场” “大厂出品”的奇骏・荣誉上新,显示11.98万起售 比亚迪海豹06DM-i旅行版怎么选 优先考虑150KM尊享型 日产召回44万辆车,可变压缩比发动机严重问题,3缸奇骏中招 不做品牌会毁了中国汽车:暴露太早的都“活不久” 小鹏G7震撼上市:19.58万起售,全球首款L3级算力AI汽车开启智驾新纪元 三星 Galaxy Z Fold 7:揭示折叠旗舰官方保护壳,含磁吸 Qi2 充电款 三星Galaxy Z Fold7真机图曝光:深蓝色配色,机身纤薄 小鹏MONA M03智能辅助驾驶系统深度解析,展现人机共驾新体验 小鹏G7正式上市:全球首款L3级算力的超级AI汽车 跳槽的尽头,为什么是汽车品牌瑞虎呢? 满血大折旗舰8999元起售 荣耀Magic V5发布会汇总 一加手机该怎么选?红黑榜帮你避坑,少花冤枉钱 中国移动与中兴联手建自智网络实验室,技术遇阻,谁能笑到最后? 千元性价比排行洗牌:红米Turbo4第四,真我Neo7第三,谁才是第一 OPPO用户扎心了!安卓16升级名单公布,这些热门机型被无情放弃 法拉利新硬顶跑车上市! 空气减震专车定制,MINI改装低趴姿态操控响应灵动敏捷 轩逸降价引爆市场!合资车大逃杀,国产车如何守住阵地? 全球超跑图鉴!百万到千万级“速度猛兽”谁最炸场 下半年SUV扎堆上市!这十款车参数价格全公开 选车先看这篇够详细 迈向全球产业高地:常州新能源汽车产业破局路径与未来发展战略解析 Grok 4意外提前曝光,xAI巨额融资700亿,马斯克宣布“重写人类知识库” 2024级宁德时代订单班选拔圆满完成——校企携手共育新能源产业技能精英