AI资讯新闻榜单内容搜索-模型

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

大语言模型（LLM）在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力，比如 OpenAI 的 o1 系列。

来自主题: AI技术研报

8657 点击 2025-03-13 14:41

号称地表最强的M3 Ultra，本地跑满血版DeepSeek R1，效果到底如何？

来自主题: AI资讯

7182 点击 2025-03-13 14:29

224张GPU，训出开源视频生成新SOTA！Open-Sora 2.0正式发布。 11B参数规模，性能可直追HunyuanVideo和Step-Video（30B）。

来自主题: AI资讯

9472 点击 2025-03-13 13:58

“大模型未来一定会经历几轮大的技术范式迭代。但比拼商业化能力，是足够确定的事。”

来自主题: AI资讯

8861 点击 2025-03-13 11:58

Anthropic 昨晚发布了他们最新的 Claude 3.7 Sonnet 混合推理模型，并在官网同步更新了 Claude 3.7 的系统提示词。

来自主题: AI技术研报

6546 点击 2025-03-13 11:54

都说通用大模型轻松拿捏翻译，结果有人来掀桌了。

来自主题: AI技术研报

7223 点击 2025-03-13 11:30

近日，记者发现，国内权威医疗大模型评测平台MedBench在官网更新了榜单。多个医疗AI产品及研究团队入榜，其中蚂蚁AI健康管家团队研发的蚂蚁医疗大模型以评测榜单97.5、自测榜单98.2的高分再度夺得双料冠军。

来自主题: AI资讯

8364 点击 2025-03-13 10:30

在实际应用过程中，闭源模型（GPT-4o）等在回复的全面性、完备性、美观性等方面展示出了不俗的表现。

来自主题: AI技术研报

8842 点击 2025-03-13 10:15

去年的诺贝尔奖梅开二度，两次颁给了AI相关领域，让所有人惊讶于AI4science的潜力。然而近日密西根大学的一项覆盖16万篇文献的大规模研究指出，AI和科学的结合仍存在错位。

来自主题: AI资讯

10104 点击 2025-03-13 10:11

近日，北京大学智能学院袁晓如课题组在中国古籍内容的智能探索方面开展跨学科合作探索取得重要进展。研究通过智能自动分类机制，从大量中国古籍中提取可视化图像，建立大规模中国古代可视化集合

来自主题: AI技术研报

9327 点击 2025-03-13 09:55