AI资讯新闻榜单内容搜索-研究

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 研究
大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了

大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了

大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了

在 ChatGPT 等大语言模型(LLMs)席卷全球的今天,越来越多的研究者意识到:我们需要的不只是 “会说话” 的 LLM,更是 “能解释” 的 LLM。

来自主题: AI技术研报
8972 点击    2025-06-22 16:25
知识储备≠模型能力!DeepMind强化学习微调:大幅缩小「知行差距」

知识储备≠模型能力!DeepMind强化学习微调:大幅缩小「知行差距」

知识储备≠模型能力!DeepMind强化学习微调:大幅缩小「知行差距」

大语言模型(LLMs)在决策场景中常因贪婪性、频率偏差和知行差距表现欠佳。研究者提出强化学习微调(RLFT),通过自我生成的推理链(CoT)优化模型,提升决策能力。实验表明,RLFT可增加模型探索性,缩小知行差距,但探索策略仍有改进空间。

来自主题: AI技术研报
7576 点击    2025-06-22 11:34
那些相信AI必然产生意识的科学家们

那些相信AI必然产生意识的科学家们

那些相信AI必然产生意识的科学家们

我怀着些许忐忑步入隔间,即将同时接受频闪灯光与音乐刺激——这是一项试图理解人类本质的研究项目的一部分。

来自主题: AI资讯
8495 点击    2025-06-21 13:21
坏了!R1的秘密被Deepmind发现了!「啊哈时刻」首次被披露,现已可量化!

坏了!R1的秘密被Deepmind发现了!「啊哈时刻」首次被披露,现已可量化!

坏了!R1的秘密被Deepmind发现了!「啊哈时刻」首次被披露,现已可量化!

自年初起,DeepSeek-R1、OpenAI o3、Qwen3等推理模型相继问世,展现出令人惊叹的智能水平,但它们为什么突然变得这么聪明?东京大学联合Google DeepMind的研究者们终于找到了答案。

来自主题: AI资讯
7148 点击    2025-06-21 13:01
DPO与GRPO谁更胜一筹?港中文、北大等联合发布首个系统性对比研究

DPO与GRPO谁更胜一筹?港中文、北大等联合发布首个系统性对比研究

DPO与GRPO谁更胜一筹?港中文、北大等联合发布首个系统性对比研究

近年来,强化学习 (RL) 在提升大型语言模型 (LLM) 的链式思考 (CoT) 推理能力方面展现出巨大潜力,其中直接偏好优化 (DPO) 和组相对策略优化 (GRPO) 是两大主流算法。

来自主题: AI技术研报
8790 点击    2025-06-20 10:53
字节再推新品,小云雀决战视频AI Agent?

字节再推新品,小云雀决战视频AI Agent?

字节再推新品,小云雀决战视频AI Agent?

DataEye研究院发现,日前,字节旗下剪映团队推出了一款全新AI应用——小云雀,该应用定位为“内容创作Agent”,包含了智能成片、AI设计等4大功能,用户只需输入文字指令,一句话便可以利用AI自动生成短视频、数字人口播、海报等,主打“创作零门槛”。

来自主题: AI资讯
9390 点击    2025-06-20 10:35
AI写爆款博客火出圈,主笔竟是Claude!

AI写爆款博客火出圈,主笔竟是Claude!

AI写爆款博客火出圈,主笔竟是Claude!

普华永道的最新研究揭秘:AI不仅没抢饭碗,还让员工创效翻三倍,数据库工程师岗位暴增2312%。从招聘到绩效,AI正重塑企业运营逻辑。AI能帮你干活,但人情味还得靠自己!

来自主题: AI资讯
8529 点击    2025-06-19 16:35
ChatGPT上瘾,大脑萎缩47%!MIT祭出206页92图超长报告

ChatGPT上瘾,大脑萎缩47%!MIT祭出206页92图超长报告

ChatGPT上瘾,大脑萎缩47%!MIT祭出206页92图超长报告

AI上瘾堪比「吸毒」!MIT最新研究惊人发现:长期依赖大模型,学习能力下降、大脑受损,神经连接减少47%。AI提高效率的说法,或许根本就是误解!

来自主题: AI技术研报
7380 点击    2025-06-19 15:04
斯坦福最新研究:硅谷的AI创业潮,其实是一场大型的资源错配

斯坦福最新研究:硅谷的AI创业潮,其实是一场大型的资源错配

斯坦福最新研究:硅谷的AI创业潮,其实是一场大型的资源错配

2025年1月到5月间,斯坦福大学的研究团队完成了一项本应在AI热潮开始时就进行的调查。他们采访了1500名美国员工和52名AI专家,评估了104个职业中的844项具体任务。

来自主题: AI技术研报
8402 点击    2025-06-19 11:40
字节Seed提出序贯策略优化方法,突破同传“质量-延迟”权衡问题

字节Seed提出序贯策略优化方法,突破同传“质量-延迟”权衡问题

字节Seed提出序贯策略优化方法,突破同传“质量-延迟”权衡问题

为此,香港中文大学、字节跳动Seed和斯坦福大学研究团队出手,提出了一种面向同声传译的序贯策略优化框架 (Sequential Policy Optimization for Simultaneous Machine Translation, SeqPO-SiMT)。

来自主题: AI技术研报
7787 点击    2025-06-19 11:31