首页 > 生活分享 > 免费教学 > 微软Phi-3-vision基准测试,和Gemini 1.0 Pro相当

微软Phi-3-vision基准测试,和Gemini 1.0 Pro相当

发布时间:2024-05-28 22:43:12来源: 15210273549

之家 5 月 28 日消息,微软在 Build 2024 大会上发布了 Phi-3 家族的最新成员--Phi-3-vision,主打“视觉能力”,能够理解图文内容,同时据称可以在移动平台上流畅高效运行。

Phi-3-vision 是一款多模态小型语言模型(SLM),主要用于本地 AI 场景,该模型参数量为 42 亿,上下文长度为 128k token,能够为常规视觉推理任务和其他任务提供支持。

那么 Phi-3-vision 有多厉害?微软今天发布了新的论文 [PDF],表示该 SLM 和 Claude 3-haiku、Gemini 1.0 Pro 等其他模型不相上下。

微软在论文中对比了 ScienceQA、MathVista 和 ChartQA 等模型,Phi-3-vision 的参数虽然不多,但性能非常优秀。

IT之家此前报道,微软提供了 Phi-3-vision 相较于字节跳动 Llama3-Llava-Next(8B)、微软研究院和威斯康星大学、哥伦比亚大学合作的 LlaVA-1.6(7B)、阿里巴巴通义千问 QWEN-VL-Chat 模型等竞品模型的比较图表,其中显示 Phi-3-vision 模型在多个项目上表现优异。

目前微软已经将该模型上传至 Hugging Face,感兴趣的小伙伴们可以访问项目地址:点此进入。

 

免费教学更多>>

英特尔发布入门级“Core Ultra 200”工作站、台式机和笔记本电脑CPU WWDC 2025前瞻:从iOS 19到AI和iPad功能再突破,共有5大看点 3%成房贷利率“分水岭”,后续下调空间存多少?悬念即将揭晓 台北100㎡新房爆火!无电视墙无墙砖,凭啥被夸“装修教科书”? 热销楼盘背后,光谷楼市释放回暖新信号 真实!赣州7大片区最新房价大曝光!哪里波动最大? 红魔10S Pro系列手机搭载520Hz游戏肩键,支持防手汗算法 家电专家力荐!TCL T6L Pro 成 618 电视选购优选 这个造型很别致!Polaroid、MoMA共同推出限量版拍立得相机 618下骁龙8至尊版新机PK realme GT 7 Pro和红米 K80 Pro谁性价比更高? 华为首发!中国低轨卫星通信公测,下半年手机直连卫星组网 华为nova14 Ultra:一部会呼吸的旗舰手机 vivo Pad5 Pro,安卓平板“全能王”诞生!天玑9400+3.1K巨幕 vivo S30系列来袭!小屏旗舰6500mAh续航炸裂 5月29日!vivo S30携萌趣IP与超强影像来袭 vivo S30系列满足年轻用户的审美需求打造的沉浸式生活美学 荣耀Magic8系列也要做小屏手机,天玑9500骁龙8 Elite 2双管齐下 荣耀400系列开启全球征程,国行版或是同档天花板 电竞三芯加持!一加Ace 5至尊版曝光,相比友商的至尊版如何? 紫光展锐处理器手机推荐 焕新客厅的秘密,TCL T7L Pro 用实力种草我全家! 索尼PlayStation 20周年:PS1开启娱乐帝国的序章 红米K80深度评测:重新定义中端机市场的技术美学 魅族Note16:设计灵感与国民手感的完美融合,618优惠活动开启 真我新机预热,下代旗舰在路上 华为新手机卖疯了!几百个应用集体跟进…这次鸿蒙系统真火了 为什么说Nova14是最值得买的华为手机? 消息称某厂下一代大折叠排期2026Q1,预计为OPPO Find N6 华为发布首款鸿蒙折叠电脑,定义“未来电脑态” 胶片色彩+萌力暴击!vivo S30系列5月29日来袭