首页 > 生活分享 > 免费教学 > 谷歌Gemini预告片展示惊艳语音视频交互能力

谷歌Gemini预告片展示惊艳语音视频交互能力

发布时间:2024-05-14 23:17:16来源: 15210273549

 5 月 14 日消息,人工智能聊天机器人领域烽烟再起,谷歌和 OpenAI 之间激烈的竞争态势愈演愈烈。就在谷歌一年一度的 I / O 开发者大会召开前夕,这家科技巨头发布了一段视频,展示了疑似经过升级的 Gemini 聊天机器人。视频中,Gemini 可以同时实时处理来自视频和语音的输入。

这段视频貌似是在 I / O 大会搭建现场拍摄的,视频展示了 Gemini 在一台 Pixel 手机上流畅地处理实时视频和语音提问,并准确地提供信息。当被问到正在进行的布置工作时,Gemini 正确识别出这是为一个重要活动做的准备。

 

整个对话过程自然流畅,Gemini 还会询问用户注意到的细节,成功识别出了该活动为谷歌 I / O 开发者大会,并进行了简要介绍。

谷歌发布该预告片的时机非常巧妙,恰好在 OpenAI 有关 ChatGPT 的发布会前几个小时,OpenAI 在此发布会上推出了全新的 ChatGPT-4o 大模型,其理解和对话的流畅性以及连贯性方面都达到了无与伦比的水平。

虽然过去的一些演示视频让外界对这类内容持有一定的怀疑态度,但今天展示的案例无疑证实了人工智能聊天机器人可以无缝集成语音和视频输入。这种多模态能力,加上非常自然的对话流,让我们仿佛看到了未来人工智能交互的一瞥。

谷歌 I / O 大会主题演讲将于明天凌晨 1 点举行,届时IT之家将第一时间带来相关报道。

免费教学更多>>

智能驾驶技术突破:实测复杂路况下的惊艳表现 CCF人工智能素养提升行动倡议发布 AI虚拟账号成起号新套路 背后哪些隐患不容忽视? 2025年5月10日,二手房交易数据速览 首套新房花28万装成这样?看完我酸了! 去年5万+的楼盘,现在成交价连连攀上7字头 “地王潮”重现!房价要一飞冲天?这轮行情与8年前有本质不同 2025年房产继承新规重磅出炉!5大变化让“争房大战”有终局方案 iOS18.5RC版本不同机型升级建议来了! 一加平板2 Pro将于5月13日预售,骁龙8至尊版芯片加持 酷睿Ultra 200V系列处理器实测:Lunar Lake架构能效比有多惊艳? 显卡一二三线品牌有哪些?哪些是杂牌?带你避坑 南京信为峰取得超薄加固型全面屏显示器专利,能够解决电磁信号泄漏及抗电磁干扰问题 淘天小红书「复婚」,电商的未来离不开内容 京东联姻胖东来,零售“终极王炸”来了? 仰望上海车展发布新车U8L 定位全尺寸行政豪华SUV“又大又豪” 拒绝 “变形竞争”,一汽-大众给出全新解法 雪铁龙3月销量仅为1395辆,环比下滑30.07%! 深蓝S09上海车展预售,全系5座6座可选23.99万起 上海车展进行中,谁还关心夏一平? 拒绝“伪需求”,东风本田S7让电车回归“人”的本质 2025年广东海洋大学招聘辅导员公告(32人) 2025年广州工程技术职业学院第一批招聘一般岗位公告(7人) 2025年广州市越秀区华乐街招聘综合行政执法队协管员公告(1人) 2025年始兴县太平镇人民政府青年就业见习基地招募见习人员公告(15人) 2025年衡水市冀州区招聘第二批社区工作者公告 岚图L3智能架构引热议!车主吐槽“变懒”,高管回应安全黑科技 3款新品重磅齐发 江淮1卡玩转全场景运输新价值 智能电动汽车强监管,沃尔沃全新XC90的安全叙事恰逢其时 上海车展的祛魅时刻到了