AI资讯新闻榜单内容搜索-SOTA

Qwen新开源，把AI生图里的文字SOTA拉爆了

通义模型家族，刚刚又双叒开源了，这次是Qwen-Image——一个200亿参数、采用MMDiT架构的图像生成模型。这也是通义千问系列中首个图像生成基础模型。

来自主题: AI技术研报

6970 点击 2025-08-05 17:10

字节Seed数学新模型，SOTA了

不仅能达IMO银牌水准，更能解决普特南数学竞赛难题，甚至超越顶尖模型o4-mini！字节发布全新复杂数学解决模型——Seed-Prover。

来自主题: AI技术研报

7884 点击 2025-08-04 20:45

又一SOTA级开源模型！阶跃Step-3多模态推理登顶，百万token解码成本不到4毛钱

又一个SOTA基础模型开源，而且依然是国产。刚刚，阶跃星辰兑现了WAIC上的承诺，将最新多模态推理模型Step-3正式开源！在MMMU等多个多模态榜单上，它一现身就取得了开源多模态推理模型新SOTA的成绩。

来自主题: AI技术研报

7426 点击 2025-08-01 12:52

通义实验室大火的 WebAgent 续作：全开源模型方案超过GPT4.1 , 收获开源SOTA

WebAgent 续作《WebShaper: Agentically Data Synthesizing via Information-Seeking Formalization》中

来自主题: AI资讯

6679 点击 2025-07-30 11:26

英伟达全新开源模型：三倍吞吐、单卡可跑，还拿下推理SOTA

众所周知，老黄不仅卖铲子（GPU），还自己下场开矿（造模型）。

来自主题: AI资讯

7566 点击 2025-07-30 10:37

开源Qwen一周连刷三冠，暴击闭源模型！基础模型推理编程均SOTA

卷疯了，通义千问真的卷疯了。

来自主题: AI技术研报

9601 点击 2025-07-28 10:21

训练数据爆减至1/1200！清华&生数发布国产视频具身基座模型，高效泛化复杂物理操作达SOTA水平

机器人能通过普通视频来学会实际物理操作了！来看效果，对于所有没见过的物品，它能精准识别并按照指令完成动作。

来自主题: AI技术研报

6815 点击 2025-07-26 11:58

WAIC抢先爆料：金融“黑马”大模型超DeepSeek刷新SOTA，论文已上线

又到了一年一度“中国AI春晚”WAIC，各家大厂动作频发的时候。今年会有哪些看点？你别说，我们还真在扒论文的过程中，发现了一些热乎线索。比如蚂蚁数科的金融推理大模型，发布会还没开，技术论文已悄咪咪上线。金融领域的推理大模型，你可以理解为金融领域的DeepSeek，带着SOTA的刷榜成绩来了。

来自主题: AI资讯

7338 点击 2025-07-25 17:40

Agent KB：经验池让Agents互相学习！GAIA新开源SOTA，Pass@1性能最高提升6.66

近日，来自 OPPO、耶鲁大学、斯坦福大学、威斯康星大学麦迪逊分校、北卡罗来纳大学教堂山分校等多家机构的研究团队联合发布了 Agent KB 框架。这项工作通过构建一个经验池并且通过两阶段的检索机制实现了 AI Agent 之间的有效经验共享。Agent KB 通过层级化的经验检索，让智能体能够从其他任务的成功经验中学习，显著提升了复杂推理和问题解决能力。

来自主题: AI技术研报

8110 点击 2025-07-25 16:50

开源Qwen凌晨暴击闭源Claude！刷新AI编程SOTA，支持1M上下文

编程Agent王座，国产开源模型拿下了！就在刚刚，阿里通义大模型团队开源Qwen3-Coder，直接刷新AI编程SOTA——不仅在开源界超过DeepSeek V3和Kimi K2，连业界标杆、闭源的Claude Sonnet 4都比下去了。

来自主题: AI资讯

9474 点击 2025-07-23 09:09