AI资讯新闻榜单内容搜索-SOTA

AI打通第一/第三人称视觉，跨视角视觉理解新SOTA｜ICCV 2025 Highlight

具身智能落地迈出关键一步，AI拥有第一人称与第三人称的“通感”了！

来自主题: AI技术研报

10207 点击 2025-10-20 12:33

边打字边出片，交互式生成长视频！英伟达联合MIT开源新SOTA

AI拍长视频不再是难事！LongLive通过实时交互生成流畅画面，解决了传统方法的卡顿、不连贯等痛点，让普通人都能轻松拍大片。无论是15秒短片还是240秒长片，画面连贯、节奏流畅，让创作变得像打字一样简单。

来自主题: AI技术研报

8723 点击 2025-10-18 12:15

全球第一，最强OCR之神诞生！百度这个0.9B开源模型问鼎SOTA

百度登顶全球第一！最新模型「PaddleOCR-VL」以0.9B参数量，在全球权威榜单OmniDocBench V1.5中以92.6分夺得综合性能第一，横扫文本识别、公式识别、表格理解与阅读顺序四项SOTA。

来自主题: AI资讯

9816 点击 2025-10-17 21:46

ICCV 2025 | FDAM：告别模糊视界，源自电路理论的即插即用方法让视觉Transformer重获高清细节

针对视觉 Transformer（ViT）因其固有 “低通滤波” 特性导致深度网络中细节信息丢失的问题，我们提出了一种即插即用、受电路理论启发的频率动态注意力调制（FDAM）模块。它通过巧妙地 “反转” 注意力以生成高频补偿，并对特征频谱进行动态缩放，最终在几乎不增加计算成本的情况下，大幅提升了模型在分割、检测等密集预测任务上的性能，并取得了 SOTA 效果。

来自主题: AI技术研报

7766 点击 2025-10-16 14:35

万亿级思考模型，蚂蚁首次开源！20万亿token搅局开源AI

在AI浪潮中，蚂蚁集团重磅推出万亿参数思考模型Ring-1T，不仅在数学竞赛上刷新开源SOTA，还在逻辑推理和医疗问答中脱颖而出。实测显示，其推理能力直逼闭源巨头，开源AI迈入万亿参数时代。

来自主题: AI资讯

8090 点击 2025-10-15 14:48

抖音&LV-NUS开源多模态新模，以小博大刷新SOTA，8B推理比肩GPT-4o

2B模型在多个基准位列4B参数以下开源第一。抖音SAIL团队与LV-NUS Lab联合推出的多模态大模型SAIL-VL2。

来自主题: AI技术研报

8343 点击 2025-10-13 15:58

国产游戏理解模型刷新SOTA，对话逗逗AI CEO：开源模型+行业数据是突破关键

游戏理解领域模型LynkSoul VLM v1，在游戏场景中表现显著超过了包括GPT-4o、Claude 4 Sonnet、Gemini 2.5 Flash等一众顶尖闭源模型。背后厂商逗逗AI，亦在现场吸引了不少关注的目光。

来自主题: AI资讯

9905 点击 2025-10-11 17:25

开源编程模型王座易主了，谁能想到新SOTA是快手

开源编程模型王座，再度易主！来自快手的KAT-Dev-72B-Exp，在SWE-Bench认证榜单以74.6%的成绩夺得开源模型第一。KAT-Dev-72B-Exp是KAT-Coder模型的实验性强化学习版本。

来自主题: AI资讯

12266 点击 2025-10-11 15:57

Jina Reranker v3: 全新“列式”重排器，0.6B参数刷新文档检索SOTA

我们正式推出第三代重排器 Jina Reranker v3。它在多项多语言检索基准上刷新了当前最佳表现（SOTA）。这是一款仅有 6 亿参数的多语言重排模型。我们为其设计了名为 “last but not late” （中文我们译作后发先至）的全新交互机制，使其能接受 Listwise 即列式输入，在一个上下文窗口内一次性完成对查询和所有文档的深度交互。

来自主题: AI技术研报

11153 点击 2025-10-10 13:11

首个全自动AI科学家诞生！西湖大学最新成果：性能超越人类SOTA基线183.7%

最近，来自西湖大学的自然语言处理实验室发布了DeepScientist系统，这也是首个具有完整科研能力，且在无人工干预下，展现出目标导向、持续迭代、渐进式超越人类研究者最先进研究成果的AI科学家系统。

来自主题: AI资讯

11785 点击 2025-10-09 12:26