首页 > 生活分享 > 免费教学 > 90/270亿参数,谷歌发布Gemma 2 AI大语言模型

90/270亿参数,谷歌发布Gemma 2 AI大语言模型

发布时间:2024-06-28 22:52:09来源: 15210273549

 6 月 28 日消息,谷歌公司昨日发布新闻稿,面向全球研究人员和开发人员发布 Gemma 2 大语言模型,共有 90 亿参数(9B)和 270 亿参数(27B)两种大小。

Gemma 2 大语言模型相比较第一代,推理性能更高、效率更高,并在安全性方面取得了重大进步。

谷歌在新闻稿中表示,Gemma 2-27B 模型的性能媲美两倍规模的主流模型,而且只需要一片英伟达 H100 ensor Core GPU 或 TPU 主机就能实现这种性能,从而大大降低了部署成本。

Gemma 2-9B 模型优于 Llama 3 8B 和其他类似规模的开源模型。谷歌还计划在未来几个月发布参数为 26 亿的 Gemma 2 模型,更适合智能手机的人工智能应用场景。

谷歌表示为 Gemma 2 重新设计了整体架构,实现卓越的性能和推理效率。IT之家附上 Gemma 2 主要特点如下:

性能优异:

27B 版本在同规模级别中性能最佳,甚至比两倍于其尺寸的机型更具竞争力。9B 版本的性能在同类产品中也处于领先地位,超过了 Llama 3 8B 和其他同规模的开放模型。

效率和成本:

27B Gemma 2 模型可在单个谷歌云 TPU 主机、英伟达 A100 80GB Tensor Core GPU 或英伟达 H100 Tensor Core GPU 上以全精度高效运行推理,在保持高性能的同时大幅降低成本。这使得人工智能部署更容易实现,预算也更合理。

跨硬件快速推理

Gemma 2 经过优化,可在各种硬件(从功能强大的游戏笔记本电脑和高端台式机到基于云的设置)上以惊人的速度运行。

在 Google AI Studio 中尝试全精度的 Gemma 2,在 CPU 上使用 Gemma.cpp 的量化版本解锁本地性能,或通过 Hugging Face Transformers 在配备 NVIDIA RTX 或 GeForce RTX 的家用电脑上进行尝试。

免费教学更多>>

模块化设计,HyperX极度未知推出Pulsefire Saga系列鼠标 技嘉推出搭载英特尔Twin Lake、Arrow Lake处理器的BRIX迷你主机 2025年处理器盘点:新款英特尔和AMD笔记本CPU,可以收藏一下! DIY小技巧:RTX 50系显卡PCIe 5.0问题汇总解答 手机、电脑内存告急!这不比公有云盘快,比NAS便宜 技嘉CES 2025发布B860系列主板:引入显卡SSD快拆设计 铭凡推出AI X1迷你主机:AMD锐龙AI 9 HX 370、OCuLink 腾讯微信官网上架华为纯血鸿蒙HarmonyOS版客户端 海尔生物接待5家机构调研,包括易方达基金、文渊资本、青岛国信产融等 格力中央空调迈出关键一步 宣布全新战略布局 美的工业技术再添三项“国际领先”技术 亚冬盛会倒计时,长虹跨越三千里送热情入“尔滨” 机器人创新巅峰对决 上海“小油”斩获第一 智能篮球训练机器人亮相CES 2025:AI追踪+自动回传,售1000美元 如何规模化实现完全自动驾驶?Mobileye提出解题“新”思路 国内首台300吨全向室外重载无人驾驶AGV(自动引导运输车)在津下线 经济日报:着力降低人工智能应用门槛 新房入住两年,说说我家装修时做的“最牛”的5个决定,太明智了 装企借助抖音直播“起死回生”,2025年短视频直播方法论是什么? 每9人就有1人从事电商相关工作,江苏宿迁蓄力打造“电商名城” 天猫宝藏新品牌双11VI方案 拼多多、淘宝、抖音接连调整!开启新一轮电商营商环境优化 25年救楼市的第一枪,打响了! 现在说房价会上涨,可能“疯”了!老旧小区或将成为“抢手货”? 苹果:果农让价出货 备货持续进行 聚焦用户体验实现全域增长 京东之家与vivo达成合作共识 5款最佳的荣耀手机,配置强颜值高! 荣耀“新卷王”,512GB+6000mAh+LCD护眼屏,发布7个月跌至1230元 新手机卖不动?这四款前代旗舰堪称新品绊脚石,他们到底好在哪! 国补政策2025年最新消息:有国补后怎么买手机最划算?华为苹果对比