谷歌深夜放性价比“猛兽”!Gemini 3.1 Flash轻量版干翻前辈,价格打骨折

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
谷歌深夜放性价比“猛兽”!Gemini 3.1 Flash轻量版干翻前辈,价格打骨折
5551点击    2026-03-04 11:29

谷歌深夜放性价比“猛兽”!Gemini 3.1 Flash轻量版干翻前辈,价格打骨折


首Token提速2.5倍,推理成绩干翻前代大模型。


智东西3月4日报道,今日凌晨,Gemini 3.1 Flash-Lite正式发布,谷歌官方介绍该模型为Gemini 3系列中速度最快、性价比最高的模型,专为应对大规模开发者工作负载而设计。


根据Artificial Analysis基准测试,Gemini 3.1 Flash-Lite的首Token响应速度较2.5 Flash提升2.5倍,每秒输出Tokens数达389个排名第一,较2.5 Flash提升45%,同时保持了与2.5 Flash相近或更高的生成质量。


谷歌深夜放性价比“猛兽”!Gemini 3.1 Flash轻量版干翻前辈,价格打骨折

▲Artificial Analysis生成速度榜单(来源:Artificial Analysis)


谷歌深夜放性价比“猛兽”!Gemini 3.1 Flash轻量版干翻前辈,价格打骨折

▲与2.5 Flash生成速度对比


该模型在Arena.ai排行榜取得1432分的Elo评分,在推理基准测试GPQA Diamond中获得86.9%的分数,在多模态理解测试MMMU Pro的成绩达76.8%,超越前代大型模型如2.5 Flash。


谷歌深夜放性价比“猛兽”!Gemini 3.1 Flash轻量版干翻前辈,价格打骨折

▲基准测试成绩


Gemini 3.1 Flash-Lite定价为输入每百万tokens 0.25美元(约合人民币1.73元),输出每百万tokens 1.5美元(约合人民币10.35元)。


谷歌深夜放性价比“猛兽”!Gemini 3.1 Flash轻量版干翻前辈,价格打骨折

▲价格对比


即日起,Gemini 3.1 Flash-Lite预览版将通过Google AI Studio的Gemini API向开发者开放,同时企业用户可通过Vertex AI平台使用。


除原始性能外,Gemini 3.1 Flash-Lite在AI Studio和Vertex AI平台标配“ thinking levels”调节功能,开发者可灵活控制模型在任务中的“思考深度”。


Gemini 3.1 Flash-Lite既能处理大规模成本优先任务,如批量翻译、内容审核等,也能处理如生成用户界面/仪表盘、创建模拟仿真、执行多步指令等需要深度推理的复杂场景。


例如,Gemini 3.1 Flash-Lite可以在很短的时间内将数百个不同类别的商品填入一个电商网站的线框原型中。


谷歌深夜放性价比“猛兽”!Gemini 3.1 Flash轻量版干翻前辈,价格打骨折


该模型还可以用来创建一个能够为企业执行多种多步骤任务的SaaS Agent。


谷歌深夜放性价比“猛兽”!Gemini 3.1 Flash轻量版干翻前辈,价格打骨折


Gemini 3.1 Flash-Lite能够利用实时预报和历史数据,实时生成动态的气象仪表盘。


谷歌深夜放性价比“猛兽”!Gemini 3.1 Flash轻量版干翻前辈,价格打骨折


其也可以快速分析和排序大量的多模态内容,例如图像。


谷歌深夜放性价比“猛兽”!Gemini 3.1 Flash轻量版干翻前辈,价格打骨折


在谷歌的官宣推文下方,有不少外网网友都对这款模型的低成本、高效益表示赞叹。


有网友说:“思维水平功能彻底改变了游戏。“用户可以将简单的查询路由到低思维模式,将复杂的任务路由到高思维模式。这不仅节省了成本,还提高了架构的灵活性。


谷歌深夜放性价比“猛兽”!Gemini 3.1 Flash轻量版干翻前辈,价格打骨折

▲网友评论(来源:X)


更有网友直接将Gemini 3.1 Flash-Lite比喻成了“野兽”,并称“这不仅仅是迭代,它是开发者的生产力倍增器。”


谷歌深夜放性价比“猛兽”!Gemini 3.1 Flash轻量版干翻前辈,价格打骨折

▲网友评论(来源:X)


结语:谷歌追求极致性价比


在这个追求降本增效的时代,Gemini 3.1 Flash-Lite既要质量,又要速度,还要低成本,为AI应用的规模化落地提供了一种新解法。


Gemini 3.1 Flash-Lite在价格上拉低了大模型高频调用的门槛。其可调节的“思考深度”,也让开发者能根据任务的实际需要灵活分配计算资源,避免了不必要的账单。


从行业应用的角度看,这种“够用且不贵”的模型往往比一味追求参数规模的方案更具落地价值。谷歌本质上是在有限预算内,把“可用”和“够用”做了更务实的结合。


文章来自于“智东西”,作者 “王涵”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md