|

聚人网
2000活跃值=1元

首页 > 生活分享 > 免费教学 > 谷歌Gemini预告片展示惊艳语音视频交互能力

谷歌Gemini预告片展示惊艳语音视频交互能力

发布时间：2024-05-14 23:17:16

5 月 14 日消息，人工智能聊天机器人领域烽烟再起，谷歌和 OpenAI 之间激烈的竞争态势愈演愈烈。就在谷歌一年一度的 I / O 开发者大会召开前夕，这家科技巨头发布了一段视频，展示了疑似经过升级的 Gemini 聊天机器人。视频中，Gemini 可以同时实时处理来自视频和语音的输入。

谷歌Gemini预告片展示惊艳语音视频交互能力

这段视频貌似是在 I / O 大会搭建现场拍摄的，视频展示了 Gemini 在一台 Pixel 手机上流畅地处理实时视频和语音提问，并准确地提供信息。当被问到正在进行的布置工作时，Gemini 正确识别出这是为一个重要活动做的准备。

整个对话过程自然流畅，Gemini 还会询问用户注意到的细节，成功识别出了该活动为谷歌 I / O 开发者大会，并进行了简要介绍。

谷歌发布该预告片的时机非常巧妙，恰好在 OpenAI 有关 ChatGPT 的发布会前几个小时，OpenAI 在此发布会上推出了全新的 ChatGPT-4o 大模型，其理解和对话的流畅性以及连贯性方面都达到了无与伦比的水平。

虽然过去的一些演示视频让外界对这类内容持有一定的怀疑态度，但今天展示的案例无疑证实了人工智能聊天机器人可以无缝集成语音和视频输入。这种多模态能力，加上非常自然的对话流，让我们仿佛看到了未来人工智能交互的一瞥。

谷歌 I / O 大会主题演讲将于明天凌晨 1 点举行，届时IT之家将第一时间带来相关报道。

【返回列表】

特别声明：以上内容(如有图片或视频亦包括在内)为“聚人网用户上传并发布"，本平台仅提供信息存储服务。

下一篇:微软即将推出自己的手机游戏商店

上一篇:Google宣布Google Wallet将停止服务Android 9.0以下用户

免费教学更多>>

特斯拉Robotaxi车队规模达200辆全新奔驰S级即将发布，CEO称其为车型历史上最大更新之一重庆国资出手，入股一家做“机器人大脑”的公司美国多家汽车经销商完成所有权变更涉及八州十余宗交易不占领市场，却要占领“生态位”：雷诺的中国新活法小米前高管创业，获高瓴、智元等数千万投融马自达押油电混动：下一代纯电推迟至2029年 2025越南车市大反转，“丰田们”的时代变了特斯拉凭借激进定价策略巩固韩国电动汽车市场领先地位上市即爆款！全面升级的荣耀Power 2销量不俗，10080mAh+240万跑分微信等APP狂吃手机存储：1TB份额占比翻倍 64GB要绝迹了 2026，不犯错，就是车企最大的赢面 iPhone阵容调整，库克卸任倒计时一心当网红的魏建军，长城汽车面对仅132万辆的年销量，犯愁了没？ “撞名”蔚来？星途全新系列亮相加95号省油？实测打脸：油耗更高，钱包更瘪！量产大灯上身，“新世代”X5呼之欲出人形机器人概念刺激汽车行业目标320万辆，奇瑞今年开始“求稳” 零跑新车A10预告图公布广汽与阿里云将在全栈AI领域展开合作宇树科技公布机器人交互控制新专利阿里独家掷投，原力灵机再获数亿元融资曝安世半导体客户正商谈应对方案，以规避中欧芯片争端影响亏损2.068亿美元，法拉第未来发布2025年Q3财报特斯拉上海超级工厂第500万个电池包下线 2025年1-9月ADAS供应商装机量排行榜：多强竞争、自主供应商强势突围比亚迪领跑东南亚、吉利奇瑞深耕独联体市场丨2025年9月，中国车企出口新动态北京人形机器人创新中心XR-1模型通过具身智能国标北汽极狐全新MPV亮相，全新设计风格，外观很霸气，侧滑门

Copyright 2018-2025 聚人网版权所有京ICP备20190895号