近日,Open AI正式推出最新旗舰模型GPT-4o(o代表Omni,全能)。
GPT-4o作为最新旗舰模型,可以实时对音频、视觉、文本进行推理,支持文本、音频和图像的任意组合输入,并能生成文本、音频和图像的任意组合输出。其在多语言、音频和视觉能力方面相较前代也有所提升。
在发布会现场,GPT-4o讲述了一个关于机器人与爱情的故事,在这个过程中,GPT-4o不断挑战用更加情绪化、戏剧化的方式进行朗读,用户可以明显感受到其中情感与音色的变化。
Sam Altman在社交媒体上
留下一句“her”。
科幻电影《Her》似乎已走进现实。
站在“Her”来临的当下,
AI底层技术有哪些趋势或方向?
邱锂力
微软亚洲研究院副院长
微软亚洲研究院(上海)负责人
最关键的不再是掌握复杂的技术细节,而是依赖于你的想象力和目标设定。大模型可以帮助我们处理许多具体的技术问题。
@上海科技
站在这个时间节点,您觉得AI底层技术有哪些趋势或方向?
@邱锂力
AI的应用已经涵盖了生活的各个方面,我们特别关注以下三个方向:
一是效率。目前AI的训练和使用成本仍然较高,我们正在不同层面上努力提升效率,包括从引擎到平台,再到实际应用的各个环节。
二是多模态。AI技术已经能处理不同的数据模态,如文本、图片、视频和语音。然而,要支持医疗等特定应用,我们还需处理更多如生理信号、无线感知技术(包括WiFi、毫米波和激光雷达)等不同于传统模态的数据。我们致力于更好地支持这些新模态,并探索如何将它们与传统模态结合,这一领域有巨大的发展潜力。
三是应用。尽管大模型的能力非常强大,但要将它们应用到具体行业中,仍面临许多新的问题和挑战。在解决这些问题的同时,也带来了很多机遇。
@上海科技
在未来的人才引进策略上,微软亚洲研究院(上海)有哪些计划?目前团队的年龄结构是怎样的?
@邱锂力
我们的团队非常年轻,我们在持续招聘全职研究员和实习生。上海是一个国际化的平台,比较容易吸引来自全球各地的人才。最近,我们还吸引了两位跨学科的人才。一位是医学专业毕业的创业者,他曾开发过应用于医疗领域的AI技术,所以在我们讨论医疗项目时贡献了很多宝贵意见,碰撞出很多火花,我们在医疗方面也有很多新的研究方向正在推动中。另一位是神经科学家,他有理论物理的背景,对AI非常熟悉。我们认为,许多前沿技术的发展需要跨学科和跨领域的合作。