OpenRouter 再度上线了一款新模型,Horizon Beta 。这款模型是之前上线的模型Horizon Alpha 的提升版本。不出意外,这款模型也是来自于 OpenAI。
再想到之前有关GPT-5以及开源模型的泄露,基本可以断定,下周应该就是 OpenAI 的主会场了。
那这个模型的实际效果我也快速上手了一下,毕竟现在还不确定具体是哪款模型,等真正揭晓之后,再深入测试下。
画一个赛博朋克风格的机器人 SVG 图像
画一个xbox 手柄 SVG 图像
使用 HTML, CSS, JS 制作一个 俄罗斯方块游戏
还不错,游戏能玩。整体统计元素都有,就是“下一块”这里显示的有点小问题。
Use HTML, CSS, JS to build a Flappy bird game
手残党的噩梦游戏属于是。游戏做得没啥问题。
Create a mesmerizing animated visualization of the Fourier series approximation of a square wave using rotating circles (epicycles).
这个是让模型制作一个令人着迷的可视化动画,要求是用“旋转的圆“来展示傅里叶级数逼近的过程。
听上去很懵逼是不是,我也一样。因为这是我在网上看到的一个 Prompt,我拿来测试下这个模型的效果。
How many "s"s and "i"s in Mississippi? make a cute card in a single HTML file
回答正确,AI 真的很喜欢这种紫色渐变风格。
最近扫毒风暴挺火的,让它结合exa search 这个 mcp 进行搜索,做一个扫毒风暴的剧情介绍网站吧。
最近《扫毒风暴》这部剧挺火的,请帮我做一个《扫毒风暴》的剧情介绍网站,以及请结合真实故事来进行介绍
mcp调用似乎还是有点问题,我在 Chatwise 中使用配置,roll 了两次都没调用。切换成 Gemini 2.5 Pro 就成功调用了。
但是根据 OpenRouter 网站上显示的模型信息,这个模型是支持工具调用的。目前是不知道哪里出现了问题,等等正式发布了再看看吧。
strawberrrrry 有几个 r
这个回答对了,好评。
如果我在太阳底下一小时能晾干 25 件衣服,晾干 30 件衣服要几个小时
这个明显回答错误了。空间足够的情况下,时间也应该是 1 小时,而不是成正比计算。
Create a 3-paragraph text of exactly 300 words, without the letter "O" or "o", explaining how airplanes works .
这个任务是创造一个三段式的文字,要 300 字,并且没有字母 "O" 或者 "o" ,来解释飞机是如何工作的。
指令遵循的稀烂无比。所以我又换了个简单点的:
将 ”I love Horizon Beta!” 这句话所有内容反过来写。
这次回答正确了。 简单的指令遵循任务还是可以的
整体上,我觉得如果这个模型是 OpenAI 要开源的模型,那我觉得效果还是不错的,速度快,效果属于中上水准。
但是如果这个是 GPT-5,那可能又一次要对 OpenAI 失望了。毕竟两年前 GPT-4 发布的时候,真的是风光无限,惊艳众人。
也不知道两年过去了,OpenAI 还能像当年一样,带给我们更多的惊喜和期待吗?
文章来自于微信公众号“BubbleBrain”。