歌放大招，AI搜索引擎来了，发布最强AI模型！发布会现场：总共提了120次AI、视频模型登场......

虽然被OpenAI抢在前面发布了重磅新品演示，但谷歌后发制人，做到了OpenAI还没能做到的事，率先发布人工智能（AI）搜索引擎，捍卫搜索领域的王者地位，同时对垒OpenAI新发布的旗舰模型GPT-4o，以升级版的最强大AI模型Gemini迎战。

从北京时间5月15日凌晨1点开始，谷歌在山景城总部附近的海岸线圆形剧场，召开了长达两个小时的年度I/O开发者大会Keynote演讲。

与预期一致，谷歌的这场发布会基本都是在谈AI、AI、AI、AI和AI。根据发布会最后的官方统计，整场Keynote的演讲稿里总共提了120次AI。

谷歌CEO Sundar Pichai表示，谷歌所有的工作都围绕生成式AI模型Gemini来做，“我们希望每个人都能从Gemini所做的事中受益。”AI搜索正是Pichai提到的Gemini融入谷歌多种服务之一。

同时谷歌搜索也将具备多步骤推理能力，可以一次性处理带有多个限制条件的长问题，并支持“拍视频”搜索解决方案的新搜索形式。

另外以上下文窗口“长”闻名的Gemini 1.5 Pro大模型，在今年晚些时候将会把100万Tokens的窗口，进一步扩大至200万Tokens，拓展同步处理多模态信息的边界。而对于一些需要快速响应的场景，谷歌也推出了Gemini 1.5 Flash模型。今年2月刚刚问世的Gemma开源模型，也将在下个月迎来参数量更大的Gemma 2。在多模态领域，谷歌也发布了文生图工具Imagen 3、与Youtube&音乐家合作的“AI音乐沙盒”，以及最新的视频生成模型Veo。而多模态Gemini Nano模型也将在今年晚些时候登陆Pixel手机，这是在本地运行的机载模型。

值得注意的是，谷歌的发布会上也有一些与昨日OpenAI发布会“雷同”的地方——实时AI助手。从今年夏天开始，Gemini也将支持语音实时交互，同时今年晚些时候还将上线实时视频交互。未来几个月内，谷歌也将推出类似于GPTs的自定义AI助手功能，叫做Gems，能够与整套“谷歌全家桶”联动。

硬件方面，谷歌宣布了第六代TPU芯片Trillium，并透露能够在明年初用上英伟达最新的Blackwell架构GPU。另外，液冷、光缆等中国股民可能会感兴趣的题材也在发布会上出现。

Gemini 1.5 Pro上下文窗口200万token

全球最长

谷歌称，推出号称有史以来最强大AI模型Gemini Advanced三个月内。从本周二起，谷歌在Gemini Advanced中加入新模型成员Gemini 1.5 Pro，称它拥有的上下文窗口在全球消费类聊天机器人中最长，窗口起始就有100万个token。Gemini 1.5 Pro将向150 多个国家地区的Gemini Advanced订阅者提供，支持超过35 种语言。

Pichai称，Gemini 1.5 Pro“提供了迄今为止所有基础模型中最长的上下文窗口。” 他介绍，Gemini 1.5 Pro将拥有200 万个token的上下文窗口，是当前模型100万个token窗口的两倍。

Gemini新语音对话功能Live定制版Gemini

谷歌称，今年夏季将扩展 Gemini 的多模态功能，包括增加用语音进行深入双向对话的能力，该功能被称为 Live。通过 Gemini Live，用户可以与 Gemini 交谈，并可以从各种自然的声音中选择它回应的声音。用户甚至可以按照自己的节奏说话，或者在回答过程中打断并澄清问题，就像在任何人类对话中一样。

歌放大招，AI搜索引擎来了，发布最强AI模型！发布会现场：总共提了120次AI、视频模型登场......

歌放大招，AI搜索引擎来了，发布最强AI模型！发布会现场：总共提了120次AI、视频模型登场......

免费教学更多>>