AI资讯新闻榜单内容搜索-sota

Jina Reranker v3: 全新“列式”重排器，0.6B参数刷新文档检索SOTA

我们正式推出第三代重排器 Jina Reranker v3。它在多项多语言检索基准上刷新了当前最佳表现（SOTA）。这是一款仅有 6 亿参数的多语言重排模型。我们为其设计了名为 “last but not late” （中文我们译作后发先至）的全新交互机制，使其能接受 Listwise 即列式输入，在一个上下文窗口内一次性完成对查询和所有文档的深度交互。

来自主题: AI技术研报

11171 点击 2025-10-10 13:11

首个全自动AI科学家诞生！西湖大学最新成果：性能超越人类SOTA基线183.7%

最近，来自西湖大学的自然语言处理实验室发布了DeepScientist系统，这也是首个具有完整科研能力，且在无人工干预下，展现出目标导向、持续迭代、渐进式超越人类研究者最先进研究成果的AI科学家系统。

来自主题: AI资讯

11802 点击 2025-10-09 12:26

更大，还能更快，更准！蚂蚁开源万亿参数语言模型Ling-1T，刷新多项SOTA

10 月 9 日凌晨，百灵大模型再度出手，正式发布并开源通用语言大模型 Ling-1T ——蚂蚁迄今为止开源的参数规模最大的语言模型。至此，继月之暗面Kimi K2、阿里 Qwen3-Max 之后，又一位重量级选手迈入万亿参数LLM 「开源俱乐部」。

来自主题: AI资讯

11071 点击 2025-10-09 11:47

1.5B推理模型新SOTA，RL训练新解法打破「简单题过拟合、难题学不动」的魔咒

QuestA（问题增强）引入了一种方法，用于提升强化学习中的推理能力。通过在训练过程中注入部分解题提示，QuestA 实现两项重大成果

来自主题: AI技术研报

9155 点击 2025-10-06 13:54

用两个简单模块实现分割理解双重SOTA！华科大白翔团队等推出多模态新框架

多模态大模型需要干的活，已经从最初的文生图，扩展到了像素级任务（图像分割）。

来自主题: AI技术研报

8269 点击 2025-10-03 14:40

全新合成框架SOTA：强化学习当引擎，任务合成当燃料，蚂蚁港大联合出品

蚂蚁通用人工智能中心自然语言组联合香港大学自然语言组（后简称“团队”）推出PromptCoT 2.0，要在大模型下半场押注任务合成。实验表明，通过“强起点、强反馈”的自博弈式训练，PromptCoT 2.0可以让30B-A3B模型在一系列数学代码推理任务上实现新的SOTA结果，达到和DeepSeek-R1-0528, OpenAI o3, Gemini 2.5 Pro等相当的表现。

来自主题: AI技术研报

8603 点击 2025-10-01 17:12

节前重磅：开源旗舰模型新SOTA，智谱GLM-4.6问世

昨天，深度求索刚刚开源 DeepSeek-V3.2-Exp。今天，另一国产大模型之光智谱 AI 也正式发布了旗下新一代旗舰模型 GLM-4.6，刚好撞车 Claude Sonnet 4.5。但有一点不同，智谱的 GLM-4.6 会继续开源，它即将上线 Hugging Face、ModelScope 等平台，遵循 MIT 协议。

来自主题: AI资讯

10347 点击 2025-10-01 11:46