AI资讯新闻榜单内容搜索-模型

如何教AI学会反思？

论文提出一种AI自我反思方法：通过反思错误原因、重试任务、奖励成功反思来优化训练。

来自主题: AI技术研报

8890 点击 2025-07-10 10:34

华为盘古之殇最新进展：华为吹哨人再发讨贼檄文

我们先给不知道剧情的朋友回归一下事件事件线：2025年6月30日，华为宣布开源盘古7B稠密和72B混合专家模型。然而发布会后，网络上出现华为盘古大模型抄袭的言论。7月5日，诺亚方舟实验室发布《关于盘古大模型开源代码相关讨论的声明》。本以为官方已经出来站台，这件事到此为止。

来自主题: AI资讯

13941 点击 2025-07-10 09:21

昆仑万维开源最强多模态推理模型！性能逼近人类专家，还超了OpenAI、Anthropic

今日，昆仑万维重磅开源多模态推理模型Skywork-R1V 3.0，这是其迄今最强多模态推理模型，参数规模为38B，在多个多模态推理基准测试中取得了开源最佳（SOTA）性能。

来自主题: AI资讯

11516 点击 2025-07-09 21:42

2025上半年大模型使用量观察：Gemini系列占一半市场份额，DeepSeek V3用户留存极高

2025 年已经过半，文本生成大模型是否已经进入下半场了？ OpenAI 完全不重视 API 市场？ Grok3 根本没人用？「大模型战」未来的走向如何？

来自主题: AI资讯

10249 点击 2025-07-09 15:30

AI版三个臭皮匠！ChatGPT/Gemini/DeepSeek合体拿下AGI测试最高分

ChatGPT的对话流畅性、Gemini的多模态能力、DeepSeek的长上下文分析……

来自主题: AI技术研报

9444 点击 2025-07-09 15:05

破解「个性化学习」长尾难题，巧用神经坍缩理论 | ICML 2025

NCAL是一种新的个性化学习方法，它通过优化文本嵌入的分布来解决教育数据中常见的长尾分布问题，从而提高模型对少数类别的处理能力。

来自主题: AI技术研报

9634 点击 2025-07-09 15:00

大模型刷数学题竟有害？CMU评估20+模型指出训练陷阱

学好数理化，走遍天下都不怕！这一点这在大语言模型身上也不例外。

来自主题: AI技术研报

8782 点击 2025-07-09 14:54

4B小模型数学推理首超Claude 4，700步RL训练逼近235B性能 | 港大&字节Seed&复旦

香港大学NLP团队联合字节跳动Seed、复旦大学发布名为Polaris的强化学习训练配方：通过Scaling RL，Polaris让4B模型的数学推理能力（AIME25上取得79.4，AIME24上取得81.2）超越了一众商业大模型，如Seed-1.5-thinking、Claude-4-Opus和o3-mini-high(25/01/31)。

来自主题: AI资讯

7773 点击 2025-07-09 12:10

毕马威重磅报告！全球超70%医疗大模型来自中国、合成生物企业已近700家……

近日，全球四大会计师事务所之一毕马威中国发布了《首届健康科技50》报告。

来自主题: AI资讯

8844 点击 2025-07-09 12:02

VLA爆发！从美国RT-2到中国FiS-VLA，机器人「即知即行」的终极进化

2025年，全球具身智能赛道爆火，VLA模型成为了绝对的C位。从美国RT-2的开创性突破，到中国最新FiS-VLA「快慢双系统」，VLA正以光速硬核进化。

来自主题: AI技术研报

8424 点击 2025-07-09 11:57