视角观测站- 领略世界，感受独特风采

首页

热点

知识

时尚

探索

综合

娱乐

视角观测站- 领略世界，感受独特风采 > 风闻讯 > 风谈站 > 正文

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude

原创风趣专 (作) 图已处理(译) 2025-07-12 04:44:41

8月2日，新王新超lmsys官方在推特发布一则消息，登基度更恭喜DeepMind研发的新王新超Gemini 1.5 Pro 实验版（0801）在Chatbot Arena排名登顶，超越GPT 4o和Claude-3.5夺得第一。登基度更

这是新王新超继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来，OpenAI第二次让出Chatbot Arena的登基度更武汉高中曝光全集Overall ranking宝座。

新王登基，新王新超Gemini 1.5 Pro再度更新，登基度更超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版（0801）在Chatbot Arena测试一周后。获得了超过12，登基度更000个社区投票，新王新超在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的登基度更好成绩。之前说GPT-4o有刷分技巧，新王新超现在看起来Gemini 1.5 Pro可能也学到了这个技巧呢。登基度更

新王登基，新王新超Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版（0801）不仅在综合表现上极为突出，在各个细分领域上也有着出色的表现。它在数学方面排名前三，武汉学院偷拍视频评价指令遵循排名前二，编码排名前五，硬提示（英语）排名前五。

Gemini 1.5 Pro 实验版（0801）具有强大的多语言能力，在中文、日语、德语、俄语方面均表现第一。

从总体胜率图上，也能看出Gemini 1.5 Pro 实验版（0801）实力强劲，对阵 GPT-4o 的胜率为 54%，对阵 Claude-3.5-Sonnet 的胜率为 59%。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

前OpenAI的开发者，现Google AI Studio的产物负责人Logan Kilpatrick火速转发，向大家宣布Gemini 1.5 Pro 实验版（0801）目前在 LMSYS 的文本和多模式排名中均位居第一的好消息。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

DeepMind的CEO Demis Hassabis也转发了这条消息，祝贺Gemini 1.5 Pro 实验版（0801）能够在极具竞争力的榜单中拿下第一，并且宣布这一版本的已经可以在 AI Studio上进行试用。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

带领研发Gemini的Jeff Dean也随后转发，对此次实验版本的Gemini 1.5 Pro突破1300+elo分数拿下排名第一的好消息感到非常自豪，也很期待未来能看到其他更好的模型。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

听闻这则消息，其他从业人员也纷纷发来祝贺。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

也有不少人分享自己的试用体验。大神elvis对在聊天机器人领域超越了 GPT-4o 和 Claude 3.5 Sonnet的Gemini 1.5 Pro非常感兴趣。elvis分享了自己的测试全过程影片，并总结道，Gemini 1.5 Pro强大的图像和PDF提取能力给他留下了深刻的印象，Gemini 1.5 Pro有着和GPT-4o不相上下的视觉能力，也有Claude 3.5 Sonnet接近的代码生成及PDF理解/推理能力。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

有人认为Gemini 1.5 Pro在解决高级数学难题方面表现相当不错。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

也有人说Gemini 1.5 Pro在图像识别植物和动物方面做得确实要比GPT 4o更好。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

也有更多的人在期待Gemini 1.5 Pro这一版本的正式上线，希望能够API实现Gemini 1.5 Pro的实际运用。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

大家对Gemini 1.5 Pro这次发布的实验版本有什么看法，欢迎评论区留言分享~雷峰网(公众号：雷峰网)雷峰网

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

新能源时代，国产3D视觉「冲击」保守的汽车行业

新能源时代，国产3D视觉「冲击」保守的汽车行业

在改革开放背景上成长起来的汽车产业，经历了飞速发展，但大量中外合资车企的涌入，也铸就了行业保守的底色，天然对国产供应商比较排斥。汽车制造业是机器视觉成熟应用的行业之一，但长期以来，国内传统燃油车产线上

7732 个星友都在看 85小时前

谁将替代 Transformer？

谁将替代 Transformer？

【雷峰网(公众号：雷峰网)】2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经，此后席卷全球的人工智能热潮都可以直接追溯到 Transformer

4154 个星友都在看 72小时前

聚焦AI科技与医疗的跨学科融合，CAIR香港人工智能与机器人医疗论坛开幕

聚焦AI科技与医疗的跨学科融合，CAIR香港人工智能与机器人医疗论坛开幕

2024年3月28日至29日，“CAIR香港人工智能与机器人医疗论坛”在香港科学园举行。论坛由中国科学院香港创新研究院人工智能与机器人创新中心主办，聚焦人工智能与机器人在医疗领域的创新应用。来自全球的

9 个星友都在看 36小时前

大模型时代的三道鸿沟：数据、成本与想象力

大模型时代的三道鸿沟：数据、成本与想象力

跨入2023年，大模型兴起、诸多公司「跑步进场」的头几个月，大模型一边倒向 C 端类 ChatGPT 的研发，对成本、效率更敏感的企业客户似乎不在关注焦点。然而近两个月，情况发生了变化。基于医疗、金融

718 个星友都在看 46小时前

2025年电影票房破300亿

2025年电影票房破300亿

来源标题：2025年电影票房破300亿从票房构成来看，年度票房榜前十名影片中，国产电影占据九席。《哪吒之魔童闹海》以超过51%的票房占比持续领跑，《唐探1900》和《封神第二部：战火西岐》分列第二、三

1 个星友都在看 14小时前

加载更多

最热

热点知识时尚探索综合娱乐休闲焦点

Copyright © 2019-2025 视角观测站- 领略世界，感受独特风采 All Rights Reserved.