AI资讯新闻榜单内容搜索-模型训练

多模态大模型事实正确性评估：o1最强，模型普遍过于自信，最擅长现代建筑/工程技术/科学

OpenAI o1视觉能力还是最强，模型们普遍“过于自信”！

来自主题: AI技术研报

8863 点击 2025-02-23 16:23

把扩散模型的生成能力与 MCTS 的自适应搜索能力相结合，会是什么结果？

来自主题: AI技术研报

8746 点击 2025-02-23 16:16

在人工智能高速发展的今天，我们似乎迎来了一个"假设爆炸"的时代。大语言模型每天都在产生数以万计的研究假设，它们看似合理，却往往难以验证。这让我不禁想起了20世纪最具影响力的科学哲学家之一——卡尔·波普尔。

来自主题: AI技术研报

9380 点击 2025-02-23 11:13

GitHub上一个开源项目彻底打破门槛：只需3块钱、2小时，普通人也能从零训练自己的语言模型！项目“MiniMind”上线即爆火，狂揽8.9k星标，技术圈直呼：“这才是AI民主化的未来！”

来自主题: AI技术研报

11382 点击 2025-02-23 10:30

DeepSeek啥都开源了，就是没有开源训练代码和数据。现在，开源RL训练方法只需要用1/30的训练步骤就能赶上相同尺寸的DeepSeek-R1-Zero蒸馏Qwen。

来自主题: AI技术研报

9710 点击 2025-02-22 21:30

卷赢大模型训练成本之后，DeepSeek正在重塑全球AI竞争格局。

来自主题: AI资讯

9726 点击 2025-02-22 16:28

不到10美元，3B模型就能复刻DeepSeek的顿悟时刻了？来自荷兰的开发者采用轻量级的RL算法Reinforce-Lite，把复刻成本降到了史上最低！同时，微软亚研院的一项工作，也受DeepSeek-R1启发，让7B模型涌现出了高级推理技能。

来自主题: AI技术研报

7462 点击 2025-02-22 15:50

YOLO 系列模型的结构创新一直围绕 CNN 展开，而让 transformer 具有统治优势的 attention 机制一直不是 YOLO 系列网络结构改进的重点。这主要的原因是 attention 机制的速度无法满足 YOLO 实时性的要求。

来自主题: AI技术研报

9902 点击 2025-02-22 14:14

在大语言模型领域中，预训练 + 微调范式已经成为了部署各类下游应用的重要基础。在该框架下，通过使用搭低秩自适应（LoRA）方法的大模型参数高效微调（PEFT）技术，已经产生了大量针对特定任务、可重用的 LoRA 适配器。

来自主题: AI技术研报

8561 点击 2025-02-22 13:57

谷歌团队发布LLM硬核技术教科书，从「系统视图」揭秘LLM Scaling的神秘面纱。Jeff Dean强调书中藏着谷歌最强AI模型Gemini训练的更多信息。

来自主题: AI技术研报

11559 点击 2025-02-21 15:52