AI资讯新闻榜单内容搜索-模型训练

国产AI拿下国际物理奥赛金牌，13项顶级竞赛豪取12金1银，划重点：开源

首个拿下国际物理奥林匹克竞赛IPhO 2025理论考试金牌的开源模型，出自国产。上海人工智能实验室团队推出新模型家族，代号P1。在IPhO 2025理论考试中，P1-235B-A22B取得21.2/30分，成为首个达到该金牌线的开源模型，仅次于Gemini-2.5-Pro与GPT-5。

来自主题: AI技术研报

7693 点击 2025-11-22 11:37

AI问答，直接「拍」给你看！来自快手可灵&香港城市大学

今天，来自快手可灵团队和香港城市大学的研究者们，正在尝试打破这一界限。他们提出了一个全新的任务范式——「视频作为答案」，并发布了相应模型VANS。而这项工作则开创性地提出了Video-Next Event Prediction任务，要求模型直接生成一段动态视频作为回答。

来自主题: AI技术研报

7944 点击 2025-11-22 11:34

SGLang Diffusion震撼发布：图像视频生成速度猛提57%！

就在一周前，全宇宙最火爆的推理框架 SGLang 官宣支持了 Diffusion 模型，好评如潮。团队成员将原本在大语言模型推理中表现突出的高性能调度与内核优化，扩展到图像与视频扩散模型上，相较于先前的视频和图像生成框架，速度提升最高可达 57%：

来自主题: AI技术研报

7391 点击 2025-11-22 11:33

GPT-5得分不到0.4！法律+金融最大规模基准：1.9万+专家评估准则

最新PRBench基准可以测试AI在金融和法律领域的表现。结果显示，即使是顶尖大模型在处理复杂任务时也表现不佳，尤其在涉及重大经济后果的任务中。PRBench通过模拟真实场景和多轮对话，揭示了AI在专业领域的不足，强调开发更可靠AI系统的重要性。

来自主题: AI技术研报

7200 点击 2025-11-22 11:33

无需训练、只优化解码策略，DTS框架让大模型推理准确率提升6%，推理长度缩短23%

专注推理任务的 Large Reasoning Models 在数学基准上不断取得突破，但也带来了一个重要问题：越想越长、越长越错。本文解读由 JHU、UNC Charlotte 等机构团队的最新工作

来自主题: AI技术研报

6807 点击 2025-11-22 11:31

4K超分Agent修图师来了！一键救活所有模糊照片

由德克萨斯A&M大学、斯坦福大学、Snap公司、CU Boulder大学、德克萨斯大学奥斯汀分校、加州理工大学、Topaz Labs以及加州大学Merced分校的研究者联合提出的基于AI智能体的方法4KAgent针对不同类型的图像以及需求对图像进行智能修复并放大到4K分辨率，带来优秀的视觉感知效果。该工作已被NeurIPS 2025接收。

来自主题: AI技术研报

7443 点击 2025-11-21 17:03