AI资讯新闻榜单内容搜索-训练

首个「万亿级时间点」预训练，清华发布生成式时序大模型日晷 | ICML Oral

清华大学软件学院发布生成式时序大模型——日晷（Sundial）。告别离散化局限，无损处理连续值，基于流匹配生成预测，缓解预训练模式坍塌，支持非确定性概率预测，为决策过程提供动态支持。

来自主题: AI资讯

10077 点击 2025-06-20 15:34

Agent全自动搭建代码运行环境，实时更新解决评测过拟合/数据污染问题｜微软

长期以来主流的代码修复评测基准SWE-bench面临数据过时、覆盖面窄、手动维护成本高等问题，严重制约了AI模型真实能力的展现。

来自主题: AI技术研报

9022 点击 2025-06-20 15:23

推荐大模型来了？OneRec论文解读：端到端训练如何同时吃掉效果与成本

人人都绕不开的推荐系统，如今正被注入新的 AI 动能。随着 AI 领域掀起一场由大型语言模型（LLM）引领的生成式革命，它们凭借着强大的端到端学习能力、海量数据理解能力以及前所未有的内容生成潜力，开始重塑各领域的传统技术栈。

来自主题: AI技术研报

9729 点击 2025-06-20 11:08

DPO与GRPO谁更胜一筹？港中文、北大等联合发布首个系统性对比研究

近年来，强化学习 (RL) 在提升大型语言模型 (LLM) 的链式思考 (CoT) 推理能力方面展现出巨大潜力，其中直接偏好优化 (DPO) 和组相对策略优化 (GRPO) 是两大主流算法。

来自主题: AI技术研报

9135 点击 2025-06-20 10:53

AI哪怕答案正确，逻辑链却惨不忍睹，奥数级不等式证明成功率不到50%｜斯坦福&伯克利&MIT

大语言模型解决不等式证明问题时，可以给出正确答案，但大多数时候是靠猜。推理过程经不起推敲，逻辑完全崩溃。

来自主题: AI技术研报

7573 点击 2025-06-20 09:48

能自我提升的Agent需要内在的元认知学习能力。| 剑桥ICML最新

剑桥大学和范德夏尔实验室在 ICML 2024 上发表的立场论文，直接挑战了当前Agent开发的核心假设：我们一直在用错误的方式让Agent"自我改进"。

来自主题: AI技术研报

7445 点击 2025-06-20 09:39

美团提出首个语音交互GUI智能体，端到端语音训练能力优于传统文本训练

只需要动动嘴就可以驱动GUI代理？

来自主题: AI技术研报

8519 点击 2025-06-19 17:07

田渊栋：连续思维链效率更高，可同时编码多个路径，“叠加态”式并行搜索

AI也有量子叠加态了？

来自主题: AI技术研报

9387 点击 2025-06-19 15:25

27、42、73，DeepSeek这些大模型竟都喜欢这些数！为什么？

42，这个来自《银河系漫游指南》的「生命、宇宙以及一切问题的终极答案」已经成为一个尽人皆知的数字梗，似乎就连 AI 也格外偏好这个数字。

来自主题: AI资讯

9042 点击 2025-06-19 15:18

ChatGPT上瘾，大脑萎缩47%！MIT祭出206页92图超长报告

AI上瘾堪比「吸毒」！MIT最新研究惊人发现：长期依赖大模型，学习能力下降、大脑受损，神经连接减少47%。AI提高效率的说法，或许根本就是误解！

来自主题: AI技术研报

7554 点击 2025-06-19 15:04

AI资讯新闻榜单内容搜索-训练

首个「万亿级时间点」预训练，清华发布生成式时序大模型日晷 | ICML Oral

Agent全自动搭建代码运行环境，实时更新解决评测过拟合/数据污染问题｜微软

推荐大模型来了？OneRec论文解读：端到端训练如何同时吃掉效果与成本

DPO与GRPO谁更胜一筹？港中文、北大等联合发布首个系统性对比研究

AI哪怕答案正确，逻辑链却惨不忍睹，奥数级不等式证明成功率不到50%｜ 斯坦福&伯克利&MIT

能自我提升的Agent需要内在的元认知学习能力。| 剑桥ICML最新

美团提出首个语音交互GUI智能体，端到端语音训练能力优于传统文本训练

田渊栋：连续思维链效率更高，可同时编码多个路径，“叠加态”式并行搜索

27、42、73，DeepSeek这些大模型竟都喜欢这些数！为什么？

ChatGPT上瘾，大脑萎缩47%！MIT祭出206页92图超长报告

AI哪怕答案正确，逻辑链却惨不忍睹，奥数级不等式证明成功率不到50%｜斯坦福&伯克利&MIT