首页 > 生活分享 > 免费教学 > 谷歌DeepMind优化AI模型新思路,计算效率与推理能力兼得

谷歌DeepMind优化AI模型新思路,计算效率与推理能力兼得

发布时间:2024-12-28 22:47:23来源: 13041198719
 12 月 28 日消息,谷歌 DeepMind 团队最新推出了“可微缓存增强”(Differentiable Cache Augmentation)的新方法,在不明显额外增加计算负担的情况下,可以显著提升大语言模型的推理性能。
 
项目背景
IT之家注:在语言处理、数学和推理领域,大型语言模型(LLMs)是解决复杂问题不可或缺的一部分。
 
计算技术的增强侧重于使 LLMs 能够更有效地处理数据,生成更准确且与上下文相关的响应,随着这些模型变得复杂,研究人员努力开发在固定计算预算内运行而不牺牲性能的方法。
 
优化 LLMs 的一大挑战是它们无法有效地跨多个任务进行推理或执行超出预训练架构的计算。
 
当前提高模型性能的方法涉及在任务处理期间生成中间步骤,但代价是增加延迟和计算效率低下。这种限制阻碍了他们执行复杂推理任务的能力,特别是那些需要更长的依赖关系或更高地预测准确性的任务。
 
项目介绍
“可微缓存增强”(Differentiable Cache Augmentation)采用一个经过训练的协处理器,通过潜在嵌入来增强 LLM 的键值(kv)缓存,丰富模型的内部记忆,关键在于保持基础 LLM 冻结,同时训练异步运行的协处理器。
 
 
 
整个流程分为 3 个阶段,冻结的 LLM 从输入序列生成 kv 缓存;协处理器使用可训练软令牌处理 kv 缓存,生成潜在嵌入;增强的 kv 缓存反馈到 LLM,生成更丰富的输出。
 
 
 
在 Gemma-2 2B 模型上进行测试,该方法在多个基准测试中取得了显著成果。例如,在 GSM8K 数据集上,准确率提高了 10.05%;在 MMLU 上,性能提升了 4.70%。此外,该方法还降低了模型在多个标记位置的困惑度。
 
 
 
谷歌 DeepMind 的这项研究为增强 LLMs 的推理能力提供了新的思路。通过引入外部协处理器增强 kv 缓存,研究人员在保持计算效率的同时显著提高了模型性能,为 LLMs 处理更复杂的任务铺平了道路。

免费教学更多>>

设计时速350公里!这条穿越秦岭的高铁,有新进展! 25款腾势D9:宜商宜家,奢享无界 25款腾势D9:能否打破销量“一万魔咒”? 想重回MPV榜首?2025款腾势D9到底升级了啥? 雷克萨斯的机会,本土向上的节点 2025款途观L低配裸车多少钱?深度解析背后的真相 2024 现代圣达菲评测:在打造出色 SUV 的所有方面均表现优异 1-11月燃油轿车销量榜!轩逸依然霸榜,卡罗拉/思域惨跌超40% 大众的几款爆款车.大众朗逸 科技重塑豪华MPV,2025款腾势D9焕新上市! 领克 Z20:智能舒享新标杆,极致驾控超体验 吕思清携弦乐大师齐聚福田,演奏结束后多次返场谢幕 极氪 拉风尾翼+大掀背+四驱!零百仅2秒多+碳陶刹车!这是国产车? 登长城、观日出、看冰海……这座古城和冬天太搭了! 2024年SUV车型颜值榜(捷豹F标志换成法拉利好呢还是兰博基尼呢) 2025款丰田Land Cruiser 300换新颜,12.3英寸数字仪表盘首曝 陈盈骏空砍38分 北汽队客场两连败 谷歌DeepMind优化AI模型新思路,计算效率与推理能力兼得 Copilot成品牌核心,更名Microsoft 365应用筑起微软AI帝国梦 宏碁新暗影骑士・擎 6 笔记本新增“i7-14650HX + 32G + 1T + RTX4070”配置 62辆新能源公交车即将“上岗” 助力城市绿色低碳出行 第一部分:上汽大众,四十而立,它还能继续“真香”吗? 李想,从天花板到瓶颈?理想AI Talk访谈实录03 盘点2024年销量最好的5款燃油轿车 轩逸/朗逸/帕萨特上榜 升红旗,赠红旗车,一汽红旗说到做到! 金标大众破局起势,走出智能电动时代新“大众路” 车企众生相:一朝黄粱梦,终有几人成? 年底买车避坑指南!三款月销量不过10台的纯电SUV盘点 蔚来ET9签名版上市,售价80.8万元,弥补你的遗憾 25万元入手新能源中大型SUV 选理想L6还是问界M7?