北京时间5月22日凌晨,在距离苹果WWDC 2024举行还有不到半个月之际,微软一年一度的Build开发者大会如期而至。
在发布会上,微软正式推出Team Copilot,将Copilot for Microsoft 365从幕后的个人AI助手,扩展为团队助手。此外,微软也宣布自己成为首批提供英伟达最新Blackwell AI 芯片的云服务商之一,与英伟达建立了“深厚的合作伙伴关系”。
值得注意的是,微软Build 2024开发者大会并没有如之前的预测一样推出「All in AI」的Windows 12,也没有针对性地推出消费者期待的AI产品,而是将重点回归到与开发者建立联系身上。
由此可见,微软此次最具想象力的升级围绕着AI Agent(AI个人助手)展开。“AI Agent本质上是通过对话式的UI来展现出部分人的属性,相当于很重要的连接器。并且增加算力后,其智力可以无限扩张。”澜码科技创始人兼CEO周健对21世纪经济报道记者表示,2023年是大语言模型的元年,2024年将是AI Agent的爆发年,AI Agent是大语言模型优先落地的最佳形态。
AI虚拟员工
微软再次掀起了一场由AI驱动的“生产力革命”浪潮。
在发布会上,微软方面宣布Microsoft Copilot Studio推出全新的Agent代理功能,让开发者能够根据特定任务和功能,构建主动响应数据和事件。基于新功能,开发者可通过记忆和知识了解上下文、推理操作和输入,并基于用户反馈进行学习,从而独立管理复杂、长期运行的业务流程。
“用户可在Teams、Loop、Planner等协作工具中调用Copilot。Team Copilot能够在会议中担任主持人,管理会议议程、跟踪会议时间并记录会议要点,也可以在聊天中作为协作者,提供重要信息、跟踪行动项目并解决未决问题。它还可以担任项目经理,帮助确保每个项目顺利推进,并及时通知团队进行输入。这些功能将在今年晚些时候推出预览版。”微软CEO萨蒂亚・纳德拉(Satya Nadella)说道。
此外,Copilot还能成为项目经理,通过创建和分配任务、跟踪截止日期等方式推动团队协作。在另一项产品更新中,微软也表示将在今年晚些时候推出一款“AI代理”工具——类似于“AI虚拟员工”,可以执行监控电子邮件、帮助新员工入职、输入数据等一系列琐碎的自动化任务。微软小心翼翼地强调,Copilot不会接管人们的工作,只会接手其中一些无聊的部分。
而在底层芯片方面,微软宣布Azure AI Studio现已支持提供GPT-4o API 将率先使用英伟达Blackwell AI芯片。纳德拉介绍,由OpeanAI开发的最新旗舰模型GPT-4o,现已在Azure AI Studio中提供,并作为API提供。该多模态模型集成了文本、图像和音频处理能力,带来了全新的生成式和对话式AI体验。
此外,由微软开发的Phi-3列AI小型语言模型(SLM)中的一种新型多模态模型Phi-3-vision现已在Azure中推出。Phi-3模型功能强大、经济高效,并且针对个人设备进行了优化。Phi-3-vision提供了输入图像和文本并接收文本响应的功能。例如,用户可以询问有关图表的问题,或询问有关特定图像的开放式问题。
开发人员可以在Azure AI Playground中试验这些前沿模型,并且可以开始使用Azure AI Studio中的模型进行构建和自定义。
AI Agent落地何时到来?
此前在OpenAI首届开发者大会(OpenAI DevDay)上,OpenAI发布了AI Agent初期形态产品GPTs,并推出了相应的制作工具GPT Builder。用户仅仅通过跟GPT Builder聊天,把想要的GPT功能描述一遍,就能生成专属GPT。
比尔·盖茨在一篇名为《人工智能将彻底改变你使用计算机的方式》的文章中,对AI Agent将对人类带来的改变进行了详细描述。
“你不必为不同的任务使用不同的应用程序。你只需用简单通俗的语言告诉你的设备你想做什么。根据你选择与软件分享多少信息,基于对你的生活有丰富的了解,软件将能够作出个性化的回应。在不久的将来,任何上网的人都可以拥有一个由人工智能驱动的个人助理,这远远超出了当今的技术水平。”比尔·盖茨说道。
由此可见,在大模型这一“巨人的肩膀之上”,AI Agent的应用之花才得以绽放。
“大语言模型有特点,它能够与人交互,从而带来范式的转变。过去我们所有的系统都是机器,人需要适应机器,才会造成人作为一个数据的搬运工作去填充空间。但今天因为有了大语言模型,我们就有机会让机器去适应人,而机器适应人就会使得大语言模型背后的这个领域模型能发挥更大的作用。”周建对记者分析称,因为人可以在机器的引导之下完成任务,人机协同完成任务才能成为可能。
在具体的商业路径方面,东吴证券发布研报指出,AI Agent未来有两大落地场景方向。
首先是智能体模拟。国内情绪消费市场仍有较大想象空间,陪伴类智能体或受益于情绪消费趋势红利,成为LLM(大语言模型)时代重要的AI原生应用。东吴证券预计,陪伴类智能体大部分商业价值集中在供给方而非平台,更加看好具备丰富IP储备或者能让用户定制智能体的玩家。
其次则是交互智能体。“智能体之间、智能体与虚拟世界内事物之间可互动,可能涌现出超越设计者规划的场景和能力,特别是对开放世界游戏等行业,可增强玩家沉浸感,解决开放世界内容消耗快的问题;多可信agent技术成熟后可能会孵化出新的游戏品类。”东吴证券指出。