AI资讯新闻榜单内容搜索-研究

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 研究
管你模型多大,250份有毒文档统统放倒,Anthropic:迄今为止规模最大的大模型数据投毒调查

管你模型多大,250份有毒文档统统放倒,Anthropic:迄今为止规模最大的大模型数据投毒调查

管你模型多大,250份有毒文档统统放倒,Anthropic:迄今为止规模最大的大模型数据投毒调查

本次新研究是迄今为止规模最大的大模型数据投毒调查。Anthropic 与英国人工智能安全研究所(UK AI Security Institute)和艾伦・图灵研究所(Alan Turing Institute)联合进行的一项研究彻底打破了这一传统观念:只需 250 份恶意文档就可能在大型语言模型中制造出「后门」漏洞,且这一结论与模型规模或训练数据量无关。

来自主题: AI技术研报
8393 点击    2025-10-10 12:14
又一推理新范式:将LLM自身视作「改进操作符」,突破长思维链极限

又一推理新范式:将LLM自身视作「改进操作符」,突破长思维链极限

又一推理新范式:将LLM自身视作「改进操作符」,突破长思维链极限

Meta 超级智能实验室、伦敦大学学院、Mila、Anthropic 等机构的研究者进行了探索。从抽象层面来看,他们将 LLM 视为其「思维」的改进操作符,实现一系列可能的策略。研究者探究了一种推理方法家族 —— 并行 - 蒸馏 - 精炼(Parallel-Distill-Refine, PDR),

来自主题: AI技术研报
8500 点击    2025-10-10 10:33
拜托了,AI!帮忙解决「看病难、看病贵」吧|对谈王国鑫:京东健康探索研究院首席科学家

拜托了,AI!帮忙解决「看病难、看病贵」吧|对谈王国鑫:京东健康探索研究院首席科学家

拜托了,AI!帮忙解决「看病难、看病贵」吧|对谈王国鑫:京东健康探索研究院首席科学家

最近,美国多家 AI+医疗明星公司接连传来进展:OpenEvidence(医学知识搜索) 的 ARR 已突破 1000 万美元,每天有上万名医生付费使用;Abridge(临床文档转写) 完成 2.5 亿美元融资;Tempus AI(肿瘤学与精准医疗) 已在纳斯达克上市,市值一度超过 60 亿美元;Hippocratic AI(医疗专属大模型) 估值也已达数十亿美元。

来自主题: AI资讯
10031 点击    2025-10-09 20:05
首个全自动AI科学家诞生!西湖大学最新成果:性能超越人类SOTA基线183.7%

首个全自动AI科学家诞生!西湖大学最新成果:性能超越人类SOTA基线183.7%

首个全自动AI科学家诞生!西湖大学最新成果:性能超越人类SOTA基线183.7%

最近,来自西湖大学的自然语言处理实验室发布了DeepScientist系统,这也是首个具有完整科研能力,且在无人工干预下,展现出目标导向、持续迭代、渐进式超越人类研究者最先进研究成果的AI科学家系统。

来自主题: AI资讯
10278 点击    2025-10-09 12:26
刚刚,清华物理传奇Yao Shunyu,跳槽谷歌DeepMind!

刚刚,清华物理传奇Yao Shunyu,跳槽谷歌DeepMind!

刚刚,清华物理传奇Yao Shunyu,跳槽谷歌DeepMind!

清华物理系传奇特奖得主姚顺宇离职Anthropic,正式加盟谷歌DeepMind!他在Anthropic仅工作一年,离职原因中约40%与公司「价值观」不合。他指出现阶段AI研究如同17世纪热力学探索:虽缺乏完整理论,却充满规律发现的契机。

来自主题: AI资讯
9697 点击    2025-10-08 11:50
从「知题」到「知人」:UserRL让智能体学会「以人为本」

从「知题」到「知人」:UserRL让智能体学会「以人为本」

从「知题」到「知人」:UserRL让智能体学会「以人为本」

来自 UIUC 与 Salesforce 的研究团队提出了一套系统化方案:UserBench —— 首次将 “用户特性” 制度化,构建交互评测环境,用于专门检验大模型是否真正 “懂人”;UserRL —— 在 UserBench 及其他标准化 Gym 环境之上,搭建统一的用户交互强化学习框架,并系统探索以用户为驱动的奖励建模。

来自主题: AI技术研报
8499 点击    2025-10-08 11:45
斯坦福华人研究火了:45分钟让你的论文变身AI智能体!

斯坦福华人研究火了:45分钟让你的论文变身AI智能体!

斯坦福华人研究火了:45分钟让你的论文变身AI智能体!

斯坦福大学研究人员提出了Paper2Agent,将静态论文转化为可交互的AI智能体,让学术成果可以直接被「调用」,为科研知识传播开辟了新模式,并为构建AI共研生态奠定基础。

来自主题: AI技术研报
8579 点击    2025-10-08 11:44
清华、NVIDIA、斯坦福提出DiffusionNFT:基于前向过程的扩散强化学习新范式,训练效率提升25倍

清华、NVIDIA、斯坦福提出DiffusionNFT:基于前向过程的扩散强化学习新范式,训练效率提升25倍

清华、NVIDIA、斯坦福提出DiffusionNFT:基于前向过程的扩散强化学习新范式,训练效率提升25倍

清华大学朱军教授团队,NVIDIA Deep Imagination 研究组与斯坦福 Stefano Ermon 团队联合提出了一种全新的扩散模型强化学习(RL)范式 ——Diffusion Negative-aware FineTuning (DiffusionNFT)。该方法首次突破现有 RL 对扩散模型的基本假设,直接在前向加噪过程(forward process)上进行优化

来自主题: AI技术研报
9592 点击    2025-10-08 11:43
千亿赛道新玩家:AI+玄学APP是下一个泛游戏风口?

千亿赛道新玩家:AI+玄学APP是下一个泛游戏风口?

千亿赛道新玩家:AI+玄学APP是下一个泛游戏风口?

“科学的尽头是玄学。”朋友圈的 985 研究生如是说。 封面图片由AI生成 “AI 说我能暴富,但我书都没翻开。” 2018 年,一个男大学生因为朋友的怂恿,酒局中打开了一本星座占卜书,当他只是根据朋

来自主题: AI资讯
7346 点击    2025-10-08 11:42
田渊栋与Russell团队联手,证明Transformer能在训练中自然学会叠加推理

田渊栋与Russell团队联手,证明Transformer能在训练中自然学会叠加推理

田渊栋与Russell团队联手,证明Transformer能在训练中自然学会叠加推理

该团队 2025 年的研究《Reasoning by superposition: A theoretical perspective on chain of continuous thought》已从理论上指出,连续思维链的一个关键优势在于它能使模型在叠加(superposition)状态下进行推理:当模型面对多个可能的推理路径而无法确定哪一个是正确时,它可以在连续空间中并行地保留所有可能的路

来自主题: AI技术研报
8672 点击    2025-10-08 11:41