6月10日消息,苹果WWDC 24(全球开发者大会)将于明日凌晨1点揭幕。虽然苹果官方发布的公告不多,但它的曝光信息却已经铺天盖地。Siri史诗级融入AI、iOS 18诸多AI新功能、与OpenAI的合作呼之欲出,苹果AI的各种动作已经成为科技圈最热的话题之一。
WWDC 24大部分活动以线上形式进行,但会在6月11日的主题演讲日于Apple Park(苹果飞船总部大楼)为特邀嘉宾举办一场线下特别活动。智东西受邀前往苹果总部,将在第一时间为你带来WWDC深度报道,期待11日凌晨与你一同见证苹果的“AI奇迹”。
从往期大会内容来看,WWDC一直以软件为中心,可以说是一场万众期待的“软件盛会”。
苹果届时将发布iOS 18,这可能成为iOS有史以来最具颠覆性的更新,而更新内容聚焦于新的AI功能和战略,将占苹果WWDC主题演讲的一半时长。
据知情人士透露,苹果的新AI系统将被称为Apple Intelligence,它将出现在iPhone,iPad和Mac操作系统的新版本上。
此外,苹果Vision Pro即将迎来第一次重大软件更新——visionOS 2要来了。苹果所有其他平台的操作系统的新版本,包括iPadOS 18、watchOS 11、macOS 15、tvOS 18也将如期而至。
至于硬件方面,在去年的WWDC上,意义重大的Vision Pro首次亮相。但截至目前,WWDC 24没有任何关于新硬件产品发布的消息。
据彭博社首席记者马克·古尔曼(Mark Gurman)报道,苹果不打算在WWDC 24上宣布任何新的硬件产品,重点将完全放在即将到来的软件更新上。
下文将根据外媒爆料的信息,梳理WWDC 24可能出现的软件更新内容,尤其是新的AI功能,包括:
整合ChatGPT的Siri
以AI为重点的iOS 18
iPadOS 18
macOS 15
visionOS 2
接下来,本文将带你深入这5大方面的数十个重磅AI升级,提前看看苹果AI大招的“前菜”。
一、Siri:整合ChatGPT,应用智能交互,多指令串联
据彭博社6月5日的报道,苹果预计很快宣布与OpenAI达成协议,将OpenAI的ChatGPT集成到iPhone的操作系统中,提供生成式AI服务。
苹果曾经率先入局,于2011年推出Siri,抢先进入语音交互和AI领域,但很快就被众多竞争对手所赶超,两年前生成式AI聊天机器人再次让苹果公司措手不及。但如今,Siri或许会成为苹果重新布局生成式AI的关键一招。
所以,苹果WWDC 24的“重头戏”,毫无疑问会是注入生成式AI后“浴火重生”的Siri。
苹果的首要任务,是借助AI让Siri更加智能,解决现有的种种问题:生硬的回复、不理解用户想法,以及“我在网络上找到这个”回应等。
基于现有信息和线索,不少外国媒体猜测,iOS 18中新版Siri或许拥有以下新AI功能:
更智能地了解用户希望Siri执行的操作
口头回答问题,而不是显示网络链接(带有ChatGPT免责声明)
了解用户的联系人、约会、位置等,以便做出更智能的响应
能够总结通知、消息和冗长文档的所有内容
能够与应用进行交互。例如“将这个备忘录移至我的新主页文件夹”
将多条指令串联在一起。例如“将这张照片裁剪成正方形并将其发送给Sam”
据知情人士透露,Siri用户将首次能够使用语音精确控制苹果自家应用中的各个功能和操作。未来,苹果会逐渐将其扩展到第三方应用,并允许用户将多个指令串联到一个请求中。
将指令串在一起的新功能,有可能解决Siri控制HomeKit设备的最大挫败感之一,目前用户没有办法实现“嘿Siri,关掉客厅灯并运行车库工作模式”的类似指令。
本质上,苹果是在借助生成式AI重建Siri,主要由大型语言模型(LLM)提供支持,很可能是苹果自己的LLM和OpenAI的ChatGPT技术的某种组合。
不过,鉴于Siri改造任务规模之巨大,预计最早在明年才会全面推出,作为iOS 18后续更新的一部分。
二、iOS 18:多个内置应用更新、AI照片编辑、自定义表情符号
iOS 18预计将包括多个内置应用的更新,包括备忘录、邮件、照片、Music和健身等。比如,照片将集成新的AI编辑功能,Music将获得AI自动生成的播放列表,日历将更好地集成提醒等。
另外,苹果AI新功能的一个重要部分是摘要功能。苹果公司正计划在 Safari 浏览器中添加一项功能,使用户能够快速回顾文章和网页内容,总结会议记录、短信和电子邮件。苹果还计划推出一项智能回顾功能,用于汇总用户错过的通知和消息。
值得注意的是,iOS 18中比较基础的AI任务将由设备本身处理,而更高级的功能则通过云计算来实现,且有专门AI算法自动判断特定任务的处理方法。
下面重点梳理iOS 18可能出现的新AI功能。
AI照片编辑功能
目前,媒体关于AI照片编辑功能方面的爆料相当笼统,但也有一些具体的功能描述,比如“一项新的清理功能,允许用户通过使用生成式AI软件从图像中删除对象”,即AI驱动的物体移除,去除照片中不需要的人和物体。
实际上,苹果一直致力于研究如何基于文本指令编辑照片,前几个月刚发布了名为“MGIE”的新型开源AI模型,可以根据自然语言指令编辑图像。
意思就是说,用户只需要告诉设备想要实现什么效果即可。例如,用户可以简单地说“让天空更蓝”,MGIE会将其解释为“识别并选择天空,然后将该区域的饱和度提高20%”。
虽然暂时还不知道MGIE的功能有多少会被整合到iOS 18中,但其可以作为AI照片编辑功能的预期。苹果的MGIE模型的功能大概有:
裁剪、调整大小、旋转、翻转
添加过滤器
识别和编辑特定的照片元素,如眼睛、头发和衣服
在苹果MGIE模型的论文和演示中,指令输入使用了键入文本。但最终在iOS 18上的效果,似乎更有可能是通过Siri指令,例如“嘿Siri,移除右边女人后面的柱子”。
AI自定义表情符号
彭博社报道称,苹果将使用生成式AI来允许用户创建自定义表情符号。
苹果正在开发相关软件,可以根据用户发短信的内容,即时创建自定义表情符号,也可能是会在用户点击表情符号菜单时,自动建议用户自定义表情符号。
更智能的Spotlight搜索
有媒体报道称,苹果正在考虑使用AI来实现更智能的Spotlight搜索,能够深入挖掘应用内信息。例如,可能实现如下搜索:
“给我看看我做的所有关于家居装修的笔记和图纸”
“给我看看我所有的奶酪食谱”
其他可能的AI功能
上述三项新AI功能,即照片编辑功能、自定义表情符号、智能Spotlight搜索,出现在iOS 18中的可能性极大。除此之外,苹果在iOS 18上还有其他媒体爆料的正在开发的新AI功能:
语音备忘录自动转录录音
邮件自动分类传入邮件
AI驱动的健康和健身教练
AI增强的日记
对错过通知和消息的智能回顾
对电子邮件和消息的建议回复
在Pages文稿中进行AI辅助写作
在Keynote讲演中创建AI辅助幻灯片
在Xcode中为开发人员编写AI代码
在 Safari中快速回顾文章和网页,总结会议笔记、短信和电子邮件
根据用户的输入(例如心情)自动生成的苹果Music播放列表