首页 > 生活分享 > 免费教学 > 微软Phi-3-vision基准测试,和Gemini 1.0 Pro相当

微软Phi-3-vision基准测试,和Gemini 1.0 Pro相当

发布时间:2024-05-28 22:43:12来源: 15210273549

之家 5 月 28 日消息,微软在 Build 2024 大会上发布了 Phi-3 家族的最新成员--Phi-3-vision,主打“视觉能力”,能够理解图文内容,同时据称可以在移动平台上流畅高效运行。

Phi-3-vision 是一款多模态小型语言模型(SLM),主要用于本地 AI 场景,该模型参数量为 42 亿,上下文长度为 128k token,能够为常规视觉推理任务和其他任务提供支持。

那么 Phi-3-vision 有多厉害?微软今天发布了新的论文 [PDF],表示该 SLM 和 Claude 3-haiku、Gemini 1.0 Pro 等其他模型不相上下。

微软在论文中对比了 ScienceQA、MathVista 和 ChartQA 等模型,Phi-3-vision 的参数虽然不多,但性能非常优秀。

IT之家此前报道,微软提供了 Phi-3-vision 相较于字节跳动 Llama3-Llava-Next(8B)、微软研究院和威斯康星大学、哥伦比亚大学合作的 LlaVA-1.6(7B)、阿里巴巴通义千问 QWEN-VL-Chat 模型等竞品模型的比较图表,其中显示 Phi-3-vision 模型在多个项目上表现优异。

目前微软已经将该模型上传至 Hugging Face,感兴趣的小伙伴们可以访问项目地址:点此进入。

 

免费教学更多>>

聚焦用户体验实现全域增长 京东之家与vivo达成合作共识 5款最佳的荣耀手机,配置强颜值高! 荣耀“新卷王”,512GB+6000mAh+LCD护眼屏,发布7个月跌至1230元 新手机卖不动?这四款前代旗舰堪称新品绊脚石,他们到底好在哪! 国补政策2025年最新消息:有国补后怎么买手机最划算?华为苹果对比 TCL C11K,电视界的 “六边形战士” 电视品牌大比拼:海信、TCL、小米、创维哪个品牌值得买? 诺基亚东软通信技术有限公司被认定为高新技术企业 八年时间,索尼「中国之星」成了吗?| 游戏专访 红米手机那么多,到底哪款才最香? 骁龙7s Gen3+6000mAh,realme也玩先锋计划真我14 Pro+未发先上架 小米2025年上半年新品汇总 全是让人尖叫的产品 史上最强畅享!华为畅享 70X颜值实力兼具,成千元市场优等生 预计华为Mate 80系列或于9月上市 较Mate 70提前两个月 国补后真香机?锐评OPPO Find X8 Pro,你究竟能获得什么体验? 深度解析 2024 款本田奥德赛:MPV 市场的实力担当? 法拉利 Purosangue 没有对手的存在. 法拉利 Purosangue 6.5L V12 迈凯伦 W1 超跑惊艳问世,3D 打印赋能极致操控 吉利集团“莲花”商标获批 路特斯正式更名为莲花跑车 十五万辆的秘密:问界M9,真香还是智商税? 开完宋PLUS DM-i,2个月后再开CR-V混动,车主:对比后差距明显 方程豹豹8、全新普拉多领衔 这10款2024年新上市SUV不容错过 2.0T、空气悬架,2+2+2座椅布局,腾势“迈巴赫”这真可以! 对标比亚迪腾势N9?领克900实车来了,3套动力可选,比路虎好看? 深圳福田与博罗共建!现代产业园已引进项目12宗 骏铃V6蓝牌清障车:江淮配玉柴,财源滚滚来 2025喜迎“开门红”——一汽奔腾与花生好车10777台订单签约 “雪龙”号再次起航!已完成长城站卸货任务 长安汽车成为国家数据安全合规车企之一 2025款别克GL8陆尊是通用的王牌