AI资讯新闻榜单内容搜索-训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 训练

DeepSeek效应初现：Grok-3补刀ChatGPT，OpenAI已在ICU?

DeepSeek效应初现：Grok-3补刀ChatGPT，OpenAI已在ICU?

DeepSeek效应初现：Grok-3补刀ChatGPT，OpenAI已在ICU?

DeepSeek和xAI相继用R1和Grok-3证明：预训练Scaling Law不是OpenAI的护城河。将来95%的算力将用在推理，而不是现在的训练和推理各50%。OpenAI前途不明，生死难料！

来自主题: AI资讯

7765 点击 2025-03-01 22:37

探索跳跃式思维链：DeepSeek创造力垫底，Qwen系列接近人类顶尖水平

探索跳跃式思维链：DeepSeek创造力垫底，Qwen系列接近人类顶尖水平

探索跳跃式思维链：DeepSeek创造力垫底，Qwen系列接近人类顶尖水平

在大语言模型 (LLM) 的研究中，与以 Chain-of-Thought 为代表的逻辑思维能力相比，LLM 中同等重要的 Leap-of-Thought 能力，也称为创造力，目前的讨论和分析仍然较少。这可能会严重阻碍 LLM 在创造力上的发展。造成这种困局的一个主要原因是，面对「创造力」，我们很难构建一个合适且自动化的评估流程。

来自主题: AI技术研报

7753 点击 2025-03-01 22:13

模型越复杂，离真理越远？我们还需要奥卡姆剃刀吗？

模型越复杂，离真理越远？我们还需要奥卡姆剃刀吗？

模型越复杂，离真理越远？我们还需要奥卡姆剃刀吗？

当百亿千亿参数的大模型霸占着科技头条，“若无必要，勿增实体”这把古老“剃刀”是否依旧闪耀？复杂性与简洁性真的是对立的吗？本文将回溯历史长河，探寻一个古老哲学原则与现代科技之间的微妙关联。在这个过程中，我们或许能够发现，复杂与简洁之间隐藏着怎样的辩证关系。

来自主题: AI技术研报

8636 点击 2025-03-01 15:28

蒸馏任何深度，仅用少量无标签数据就能实现单目深度估计新SOTA

蒸馏任何深度，仅用少量无标签数据就能实现单目深度估计新SOTA

蒸馏任何深度，仅用少量无标签数据就能实现单目深度估计新SOTA

单目深度估计新成果来了！西湖大学AGI实验室等提出了一种创新性的蒸馏算法，成功整合了多个开源单目深度估计模型的优势。在仅使用2万张无标签数据的情况下，该方法显著提升了估计精度，并刷新了单目深度估计的最新SOTA性能。

来自主题: AI技术研报

9216 点击 2025-02-28 15:40

机器人诞生「运动自我意识」，哥大华人登Nature子刊：照镜子学会自我建模

机器人诞生「运动自我意识」，哥大华人登Nature子刊：照镜子学会自我建模

机器人诞生「运动自我意识」，哥大华人登Nature子刊：照镜子学会自我建模

近日，来自哥大的研究人员开发出了一种新AI系统，让机器人通过普通摄像头和深度神经网络实现自我建模、运动规划和自我修复，突破了传统机器人依赖工程师调整的局限，使机器人能像人类一样自主学习和适应环境变化，为具身智能发展带来新范式。

来自主题: AI技术研报

10069 点击 2025-02-28 15:32

超越DeepSeek推理，效率更高！斯坦福马腾宇新作：有限数据，无限迭代

超越DeepSeek推理，效率更高！斯坦福马腾宇新作：有限数据，无限迭代

超越DeepSeek推理，效率更高！斯坦福马腾宇新作：有限数据，无限迭代

STP（自博弈定理证明器）让模型扮演「猜想者」和「证明者」，互相提供训练信号，在有限的数据下实现了无限自我改进，在Lean和Isabelle验证器上的表现显著优于现有方法，证明成功率翻倍，并在多个基准测试中达到最先进的性能。

来自主题: AI技术研报

4945 点击 2025-02-28 15:21

无需训练让扩散模型提速2倍，上交大提出Token级缓存方案｜ICLR‘25

无需训练让扩散模型提速2倍，上交大提出Token级缓存方案｜ICLR‘25

无需训练让扩散模型提速2倍，上交大提出Token级缓存方案｜ICLR‘25

Diffusion Transformer模型模型通过token粒度的缓存方法，实现了图像和视频生成模型上无需训练的两倍以上的加速。

来自主题: AI技术研报

7775 点击 2025-02-28 15:06

开源的胜利！RISC-V与AI今日全面「会师」

开源的胜利！RISC-V与AI今日全面「会师」

开源的胜利！RISC-V与AI今日全面「会师」

RISC-V 正在成为 AI 原生计算架构。

来自主题: AI资讯

6020 点击 2025-02-28 14:51

ICLR 2025｜浙大、千问发布预训练数据管理器DataMan，53页细节满满

ICLR 2025｜浙大、千问发布预训练数据管理器DataMan，53页细节满满

ICLR 2025｜浙大、千问发布预训练数据管理器DataMan，53页细节满满

在 Scaling Law 背景下，预训练的数据选择变得越来越重要。然而现有的方法依赖于有限的启发式和人类的直觉，缺乏全面和明确的指导方针。在此背景下，该研究提出了一个数据管理器 DataMan，其可以从 14 个质量评估维度对 15 个常见应用领域的预训练数据进行全面质量评分和领域识别。

来自主题: AI技术研报

9566 点击 2025-02-28 14:04

深度｜硅谷明星华裔投资人谈DeepSeek：AI模型训练和推理成本在过去18个月180倍成本降低，推动更多开源项目涌现

深度｜硅谷明星华裔投资人谈DeepSeek：AI模型训练和推理成本在过去18个月180倍成本降低，推动更多开源项目涌现

深度｜硅谷明星华裔投资人谈DeepSeek：AI模型训练和推理成本在过去18个月180倍成本降低，推动更多开源项目涌现

AI模型的训练和推理成本在过去18个月内大幅下降，达到180倍的成本降低。这一趋势推动了更多开源项目的涌现。

来自主题: AI资讯

7428 点击 2025-02-28 13:56

上一页当前第272页,共439页下一页