AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
千问 3.5:0.8 元的顶级模型,我找不到它的对手

千问 3.5:0.8 元的顶级模型,我找不到它的对手

千问 3.5:0.8 元的顶级模型,我找不到它的对手

我正对着镜子站立,举起一只手。在我的视野中,这只手出现在镜子画面的左侧。 请问在现实中,我举起的是哪只手? 答案应该是:左手。 一道堪比「9.11 > 9.8」的 AI 陷阱题。 前两天,我拿它测了一

来自主题: AI产品测评
6203 点击    2026-02-24 09:12
奥特曼:人类吃 20 年饭不如训练 AI,全网炸了,网友:你再说一遍?

奥特曼:人类吃 20 年饭不如训练 AI,全网炸了,网友:你再说一遍?

奥特曼:人类吃 20 年饭不如训练 AI,全网炸了,网友:你再说一遍?

奥特曼又又又又口出狂言了。在印度 Express Adda 的论坛上,Sam Altman 聊了很多 AI 话题,从 AGI 到中美 AI 竞争,再到数据中心用水问题。但最火的那段,是他回应 AI 能耗批评时说的:「人们总谈训练 AI 模型需要多少能源……但训练人类也需要大量能源,得花 20 年时间,消耗那么多食物,才能变聪明。」

来自主题: AI资讯
9900 点击    2026-02-23 22:49
AI 生图模型的「刻板印象」已经到达了一个很抽象的地步

AI 生图模型的「刻板印象」已经到达了一个很抽象的地步

AI 生图模型的「刻板印象」已经到达了一个很抽象的地步

马上春节假期都结束了,不知道大家有没有人被家里催婚 😭 我这几天一直躺在屋里,为了躲避惨无人道的亲戚催婚,睡得昏天暗地,睡觉、刷抖音、刷 X、刷小红书、吃饭、睡觉,闭环了。 就在昨天,我日常刷抖音的时

来自主题: AI资讯
8595 点击    2026-02-23 19:18
MiniMax 成为 Token 调用第一后,模型厂商必须面对的 AgentOS 现实

MiniMax 成为 Token 调用第一后,模型厂商必须面对的 AgentOS 现实

MiniMax 成为 Token 调用第一后,模型厂商必须面对的 AgentOS 现实

作为目前全球最主要的大模型 API 聚合网关之一,OpenRouter 的 Token 调用量在 2026 年 1 月下旬出现了明显跃升。自 1 月 26 日当周开始,平台 Token 周增量首次突破 1.5T,这一幅度在过去的调用曲线中并不常见。时间点同样值得玩味——这一轮增长几乎与 OpenClaw 的迅速传播高度重合。人们开始发现,OpenClaw 简直就是 Token 碎纸机。

来自主题: AI资讯
8958 点击    2026-02-23 19:13
GLM-5 技术报告全解读|a16z:“最好的开源模型”

GLM-5 技术报告全解读|a16z:“最好的开源模型”

GLM-5 技术报告全解读|a16z:“最好的开源模型”

a16z 昨天发了一张图,把 GLM-5 和 Claude Opus 4.6 并排标注在 Artificial Analysis Intelligence Index 的时间线上。原文的说法是: A proprietary model (Claude Opus 4.6) is still the 'most intelligent,' but the gap between

来自主题: AI技术研报
9957 点击    2026-02-22 23:06
5 亿 ARR的Cursor,已经没人讨论它了?

5 亿 ARR的Cursor,已经没人讨论它了?

5 亿 ARR的Cursor,已经没人讨论它了?

最近Cursor 发布了 Composer 1.5。这一版把强化学习规模扩大了 20 倍,后训练计算量甚至超过了基座模型的预训练投入。还加了 thinking tokens 和自我摘要机制,让模型能在复杂编程任务里做更深度的推理。

来自主题: AI资讯
9628 点击    2026-02-22 11:39
训练奖励太稀疏?港中文联合美团给Agent加上「过程分」

训练奖励太稀疏?港中文联合美团给Agent加上「过程分」

训练奖励太稀疏?港中文联合美团给Agent加上「过程分」

在很多大模型和 Agent 的训练里,最常见的一种做法就是只看结果:最后答案对了就给奖励,错了就当 0 分。 在单轮问答里,这样「只看结果」还勉强能用;可一旦换成 Agent 这种要多轮对话、搜索、刷

来自主题: AI技术研报
8342 点击    2026-02-22 11:29
ICLR 2026 | 阿里高德发布SpatialGenEval,揭秘谁才是真正的文生图大师

ICLR 2026 | 阿里高德发布SpatialGenEval,揭秘谁才是真正的文生图大师

ICLR 2026 | 阿里高德发布SpatialGenEval,揭秘谁才是真正的文生图大师

来自阿里高德的一篇最新 ICLR 2026 中稿论文《Everything in Its Place: Benchmarking Spatial Intelligence of Text-to-Image Models》提出了面向文生图空间智能的系统性评估基准 SpatialGenEval,旨在通过长文本、高信息密度的 T2I prompt 设计,以及围绕空间感知

来自主题: AI技术研报
9640 点击    2026-02-22 11:17
Gemini 3.1 Pro 曝光,能力翻倍价格不变,谷歌想重新定义 AI 竞争规则

Gemini 3.1 Pro 曝光,能力翻倍价格不变,谷歌想重新定义 AI 竞争规则

Gemini 3.1 Pro 曝光,能力翻倍价格不变,谷歌想重新定义 AI 竞争规则

当地时间 2 月 19 日,Google 曝光 Gemini 3.1 Pro 最新模型。在 ARC-AGI-2 这个公认的推理基准测试中,Gemini 3.1 Pro 拿到了 77.1% 的分数。什么概念?它的前辈 Gemini 3 Pro 只有 31.1%,就连专门用来「深度思考」的 Gemini 3 Deep Think 也只有 45.1%。

来自主题: AI资讯
8518 点击    2026-02-20 13:53
医疗AI大洗牌!斯坦福、普林斯顿发布首个医学世界模型MedOS

医疗AI大洗牌!斯坦福、普林斯顿发布首个医学世界模型MedOS

医疗AI大洗牌!斯坦福、普林斯顿发布首个医学世界模型MedOS

医疗AI终于走出了「只会聊天」的舒适区。今天,斯坦福与普林斯顿联手NVIDIA发布MedOS。这不是一个单纯的手术机器人,而是全球首个通用医疗具身世界模型。从临床诊断到治疗,从外科手术到药物研发,MedOS正在让AI真正读懂「生老病死」的物理现实。

来自主题: AI资讯
8455 点击    2026-02-20 13:37