平替版Fable 5的打开教程来了:性能追平,成本砍半

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
平替版Fable 5的打开教程来了:性能追平,成本砍半
8681点击    2026-06-14 16:04

Fable 5也不是无可替代。


Kimi、DeepSeek、Gemini三个模型合体,就能顶上了。


OpenRouter进行了一项有意思的实验,让多款大模型组队协作,结果还真测出了点东西。


平替版Fable 5的打开教程来了:性能追平,成本砍半


最新测试显示,模型抱团后实力明显升级:


Opus 4.8+GPT-5.5>Fable 5


Kimi K2.6+ DeepSeek V4 Pro+Gemini 3 Flash=Fable 5


能力追上了,开销还减半。


根据官方定价,相比Fable 5,Kimi K2.6+ DeepSeek V4 Pro+Gemini 3 Flash这套平价阵容,成本降幅接近80%。


在本次测试中,算上平台调度、内容融合等附加成本,这套组合拳单任务成本依然只有Fable 5的50%,性价比有了!


平替版Fable 5的打开教程来了:性能追平,成本砍半


多个模型组成Panel比单个模型更强


OpenRouter这次测试的核心依托于Fusion多模型融合方案


向Fusion发送指令后,系统会把任务并行分发到多个模型,所有模型都支持网页检索与内容抓取。


随后由判定模型逐一分析各家回复,梳理出共识观点、矛盾之处、信息缺口、独到见解与认知盲区,最后再基于这份分析生成最终答案。


整套流程都在服务端完成,调用体验和使用单个模型基本一致。


平替版Fable 5的打开教程来了:性能追平,成本砍半


为了验证模型的综合实力,团队选用了DRACO深度研究基准测试集


这套题库由Perplexity AI打造,专门用来考验模型处理复杂任务的能力。


这100道实战题目里,覆盖了学术、金融、法律、医疗、技术等十大领域,基本还原了职场办公、专业调研里的真实场景。


它的打分规则也比较严格,一共设置了39项加权评分标准,主要从答案准不准、内容深不深、排版观感、引用是否规范这四大维度综合评判。


当然了,最具特色的的是还加了扣分机制:


一旦回答出错、给出不当建议或是通篇废话,都会直接扣分。


所以,模型想靠堆砌文字混分数也行不通,必须得真有料才行。


平替版Fable 5的打开教程来了:性能追平,成本砍半


从测试数据来看,多模型协同的效果,整体上要强于单一模型。


一众高端模型组合后都有明显提升,Fable 5与GPT-5.5搭档,拿到了最高69.0%的成绩,超过两个模型单独参赛的分数。


Opus 4.8、GPT-5.5、Gemini 3.1 Pro等高端模型两两组合、三人组队,表现也全都优于单机状态。


当然了,这次测试结果最大的惊喜是,Kimi K2.6、DeepSeek V4 Pro、Gemini 3 Flash的组合表现几乎追平了Claude Fable 5。


平替版Fable 5的打开教程来了:性能追平,成本砍半


Fable 5(平价版


Claude Fable 5单独运行时,在DRACO测试中的标准化得分为 65.3%;


(因内容安全过滤规则,该模型仅完成100道任务中的93道)


而Kimi K2.6、DeepSeek V4 Pro、Gemini 3 Flash三款模型组成的融合阵容,综合得分达到 64.7%;


两者分差仅有0.6 个百分点,性能持平的同时,成本优势成为这套组合最大的杀手锏。


根据官方公开定价,Claude Fable 5定价高昂,每百万输入Token收费10美元,每百万输出Token 收费高达50美元,是上一代Opus 4.8的两倍。


这个价格对于日均调用量较大的企业、工作室和个人开发者而言,长期使用会产生不小的开支。


而组合里的三款模型,均属于高性价比主流模型:


DeepSeek V4 Pro经过永久降价后,百万输入Token仅需0.44美元,百万输出Token为0.87美元;


Gemini 3 Flash也主打轻量化与高性价比,调用成本同样低廉,每百万输入约0.5美元、输出3美元;


Kimi K2.6也延续了高性价比的定价策略,采用缓存计费机制,首次处理内容按0.95美元/百万Token计费,而重复使用同一上下文时,输入成本可降至0.16美元/百万Token,输出为4美元/百万Token。


三者组成融合阵容后,整体综合调用成本相比Claude Fable 5降幅接近80%。


不过,从本次测试的成本来看,不同组合的实际开销出现明显变化:


比Fable表现好的组合,受调用方式影响,整体开销也略高;


而三人组即便即便算上平台调度、内容融合等附加成本,单任务总花费依旧低于Claude Fable 5,是全场性价比最优的方案。


平替版Fable 5的打开教程来了:性能追平,成本砍半


除此之外,测试中还有一个有趣的发现,即便是单一模型自我融合,也能实现性能提升。


例如 Opus 4.8 自身组合后,得分从单体58.8%提升至65.5%。


这也侧面说明,Fusion融合方案的性能增益,不仅来自不同模型的能力互补,答案整合、逻辑梳理这一流程本身,就能优化输出质量。


同一指令交由同一模型多次运行,会产生不同的推理路径、工具调用逻辑和信息筛选结果,再经过整合优化,输出内容会更加完善。


那这套组合咋用呢?


OpenRouter针对不同使用人群,提供了简易网页端和API两种使用方式。


在网页端,可以直接选择预设组合一键启用,也可以按需搭配。


平替版Fable 5的打开教程来了:性能追平,成本砍半


如果想自动化调用,直接使用API接口,在参数里指定模型就行。


平替版Fable 5的打开教程来了:性能追平,成本砍半


感兴趣的朋友可以试试效果,毕竟组队平替是真香啊…


参考链接:

[1]https://openrouter.ai/blog/announcements/fusion-beats-frontier/

[2]https://x.com/OpenRouter/status/2065856860435988482



文章来自于微信公众号 “量子位”,作者 “量子位”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/