杀疯了！Gemini 25狂飙“高尔顿板”测试编码横扫所有OpenAI模型-九游娱乐

杀疯了！Gemini 25狂飙“高尔顿板”测试编码横扫所有OpenAI模型

游戏攻略 2025-04-20　浏览量：　

　　【新智元导读】谷歌的AI编码能力正在掀起一场风暴！在高尔顿板测试中，Gemini 2.5 Flash以惊艳表现击败OpenAI多款模型，连谷歌首席科学家Jeff Dean都为其点赞。谷歌新模型「dayhush」已在网页开发领域崭露头角，性能超越Gemini 2.5 Pro，被网友称为「AI编码的地震性突破」。

　　尤其是，AI大神Karpathy带火vibe coding（氛围编程）概念后，普通人也可九游娱乐平台以通过AI体验到编程的乐趣。

　　不只是娱乐，很多AI专家、公司CEO、行业分析师甚至认为，AI可能会在2-3年内取代绝大部分的程序员。

　　结果他发现，Gemini 2.5 Flash在这项高尔顿板测试中表现炸裂，而OpenAI的几个模型则完全不行，没能搞定这九游娱乐平台个任务。

　　在Gemini 2.5 Flash上，他一共提示5次就搞定了。而在OpenAI的模型上，RameshR则折腾了半小时都没有完成，最后直接选择放弃。

　　可以看出，Gemini 2.5 Flash生成的动画中，整个高尔顿板的排布都没有明显的问题，小球的运动、碰撞也基本符合物理规律。

　　RameshR的高尔顿板测试帖子发出后立即点燃了网友们的兴致，就连谷歌的首席科学家Jeff Dean也出来给他点赞。

　　资深工程师Ray Fernando使用相同的提示词在o4-mini-high上进行了测试，结果表现还是不太完美。

　　图片下边柱子和固定的小球已经重合到一起了，小球的排列也不符合正态分布的规律。

　　还有网友使用其他的模型做了测试，比如Alex Kotenko就使用了Claude 3.7。

　　他表示在使用了相同的初始提示和一次后续调整就完成了测试。只不过从结果来看，小球的排列并不怎么符合正态分布。

　　但小球最后的排列并不太符合正态分布规律，距离Gemini 2.5 Flash还有差距。

　　谷歌DeepMind正势如破竹！在第七代TPU Ironwood的加持下，Gemini模型不仅性能很强，性价比也格外的高。

　　刚刚，网友AshutoshShrivastava发帖称，谷歌又又又推出了一个新模型「dayhush」，已在网页开发领域上线。

　　更加夸张的是，这个新模型似乎比Gemini 2.5 Pro更出色。他还提供了新模型的一些更详细信息。

　　测试过「dayhush」的网友Taro Bushidō表示，「这将是对AI编码的一次地震性转变。」

　　「没有任何模型能够如此精确地创建youtube和spotify的用户界面。」他说。

上一个：闷声放大招！谷歌Gemini 25 Flash上线性价比碾压返回列表下一个：童话崩坏！白雪公主竟成学生会会长？这部能玩的动画RPG彻底颠<

九游娱乐 - 中国优质游戏官方平台

杀疯了！Gemini 25狂飙“高尔顿板”测试编码横扫所有OpenAI模型

更多新闻推荐

九游娱乐最老的游戏关服了哪些平台？中国游戏停服一共多少次

九游娱乐876电子游戏876电子游戏试玩平台网站

谷歌深夜“炸场”！九游娱乐官网

【老游戏巡礼】独立游戏中名副其实的史九游娱乐诗之作《史诗战斗

*合作意向

*电话

*姓名

公司

行业

职位

邮箱

地址

您的留言

您也可以拨打我们的客服电话：136-28394677 联系我们

快捷链接

九游娱乐

游戏大厅

游戏资讯

业务咨询专线