AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
17万白领岗消失!Scale AI最新研究:AI仅动用了3%实力

17万白领岗消失!Scale AI最新研究:AI仅动用了3%实力

17万白领岗消失!Scale AI最新研究:AI仅动用了3%实力

AI卷走饭碗,17万大军一夜失业。别慌,Scale AI新作一锤定音:全球六大顶尖AI,现在能自动处理的事情连3%都不到。来自Scale AI和Center for AI Safety最新研究,一句话戳破了真相:虽然AI很聪明,但还不够实用。目前,AI自动化率还不到3%。值得一提的是,论文参与者中,还有Alexandr Wang本尊,曾在Scale AI期间完成的研究。

来自主题: AI技术研报
8867 点击    2025-11-07 11:56
AI科学家登场!12小时抵人类科学家半年工作量,已有7项大成果

AI科学家登场!12小时抵人类科学家半年工作量,已有7项大成果

AI科学家登场!12小时抵人类科学家半年工作量,已有7项大成果

奥特曼称GPT-6或让「AI创造新科学」成真。与此呼应,类「AI科学家」Kosmos登场:12小时读1500篇文献、跑4.2万行代码,生成可溯源报告,并在材料等方向提出新发现。它凭持续记忆自主规划,正由工具迈向合作者;但受数据来源与复现性制约,约20%结论仍需人类裁判。人机协作或将重塑科研,科研范式加速演进,前景可期。

来自主题: AI技术研报
9827 点击    2025-11-07 10:54
如何自动优化领域任务的提示词?用EGO-Prompt|NeurIPS 2025

如何自动优化领域任务的提示词?用EGO-Prompt|NeurIPS 2025

如何自动优化领域任务的提示词?用EGO-Prompt|NeurIPS 2025

大型语言模型(LLMs)正迅速成为从金融到交通等各个专业领域不可或缺的辅助决策工具。但目前LLM的“通用智能”在面对高度专业化、高风险的任务时,往往显得力不从心。

来自主题: AI技术研报
7528 点击    2025-11-07 10:52
RLinf上新πRL:在线强化学习微调π0和π0.5

RLinf上新πRL:在线强化学习微调π0和π0.5

RLinf上新πRL:在线强化学习微调π0和π0.5

近年来,基于流匹配的 VLA 模型,特别是 Physical Intelligence 发布的 π0 和 π0.5,已经成为机器人领域备受关注的前沿技术路线。流匹配以极简方式建模多峰分布,能够生成高维且平滑的连续动作序列,在应对复杂操控任务时展现出显著优势。

来自主题: AI技术研报
10692 点击    2025-11-07 10:17
Feed-Forward 3D综述:三维视觉如何「一步到位」

Feed-Forward 3D综述:三维视觉如何「一步到位」

Feed-Forward 3D综述:三维视觉如何「一步到位」

在 3D 视觉领域,如何从二维图像快速、精准地恢复三维世界,一直是计算机视觉与计算机图形学最核心的问题之一。从早期的 Structure-from-Motion (SfM) 到 Neural Radiance Fields (NeRF),再到 3D Gaussian Splatting (3DGS),技术的演进让我们离实时、通用的 3D 理解越来越近。

来自主题: AI技术研报
6150 点击    2025-11-07 10:15
机械手真正「活」了,银河通用&清华推出DexNDM,用神经动力学重塑灵巧操作

机械手真正「活」了,银河通用&清华推出DexNDM,用神经动力学重塑灵巧操作

机械手真正「活」了,银河通用&清华推出DexNDM,用神经动力学重塑灵巧操作

机器人使用灵巧手帮人类在工厂里拧螺丝,在家里切菜做饭的一天何时可以到来?为了实现这一愿景,旨在解决灵巧操作技能 sim-to-real 难题的 DexNDM 应运而生。

来自主题: AI技术研报
6583 点击    2025-11-06 15:01
距离觉醒意识,人工智能还差一具肉身?

距离觉醒意识,人工智能还差一具肉身?

距离觉醒意识,人工智能还差一具肉身?

当AI能写诗、能编程,甚至能和你争论哲学,它会不会真的“有感觉”?它会不会像你一样,体验到红色的炙热或痛苦的尖锐?

来自主题: AI技术研报
5661 点击    2025-11-06 15:00
扩展外部测试时Scaling Law,中关村学院新发现:轻量级验证器可解锁LLM推理最优选择

扩展外部测试时Scaling Law,中关村学院新发现:轻量级验证器可解锁LLM推理最优选择

扩展外部测试时Scaling Law,中关村学院新发现:轻量级验证器可解锁LLM推理最优选择

在大语言模型(LLM)席卷各类复杂任务的今天,“测试时扩展”(Test-Time Scaling,TTS)已成为提升模型推理能力的核心思路 —— 简单来说,就是在模型 “答题” 时分配更多的计算资源来让它表现更好。严格来说,Test-Time Scaling 分成两类:

来自主题: AI技术研报
7272 点击    2025-11-06 14:59
2张4090竟能本地微调万亿参数Kimi K2!趋境联合清华北航把算力门槛击穿了

2张4090竟能本地微调万亿参数Kimi K2!趋境联合清华北航把算力门槛击穿了

2张4090竟能本地微调万亿参数Kimi K2!趋境联合清华北航把算力门槛击穿了

微调超大参数模型,现在的“打开方式”已经大变样了: 仅需2-4 张消费级显卡(4090),就能在本地对DeepSeek 671B乃至Kimi K2 1TB这样的超大模型进行微调了。

来自主题: AI技术研报
7469 点击    2025-11-06 10:52
大模型不擅长点鼠标?中科院团队打造AI专属交互界面,任务成功率提升67%

大模型不擅长点鼠标?中科院团队打造AI专属交互界面,任务成功率提升67%

大模型不擅长点鼠标?中科院团队打造AI专属交互界面,任务成功率提升67%

在日常使用电脑时,看着屏幕、点击鼠标是再自然不过的基本操作。但这种对人类明明很容易的操作方式,却成为 AI 的巨大挑战:它们视力差、动作慢、不擅长看也不擅长点。

来自主题: AI技术研报
5696 点击    2025-11-06 10:32
NeurIPS 2025 Spotlight | 你刷到的视频是真的么?用物理规律拆穿Sora谎言

NeurIPS 2025 Spotlight | 你刷到的视频是真的么?用物理规律拆穿Sora谎言

NeurIPS 2025 Spotlight | 你刷到的视频是真的么?用物理规律拆穿Sora谎言

随着生成式 AI(如 Sora)的发展,合成视频几乎可以以假乱真,带来了深度伪造与虚假信息传播的风险。现有检测方法多依赖表层伪影或数据驱动学习,难以在高质量生成视频中保持较好的泛化能力。其根本原因在于,这些方法大都未能充分利用自然视频所遵循的物理规律,挖掘自然视频的更本质的特征。

来自主题: AI技术研报
8693 点击    2025-11-06 09:39
陶哲轩,用AI爆改科研范式

陶哲轩,用AI爆改科研范式

陶哲轩,用AI爆改科研范式

陶哲轩让ChatGPT把复杂的数学论文翻译成Lean代码,与AI合作完成形式化证明。AI能理解论文、写出正确命题,却常在关键处卡壳。经过人机配合,终于生成1125行被验证的证明。

来自主题: AI技术研报
8909 点击    2025-11-06 09:37
40页的上下文工程ebook「深度拆解」|weaviate

40页的上下文工程ebook「深度拆解」|weaviate

40页的上下文工程ebook「深度拆解」|weaviate

如果你也在做 RAG 或智能体应用,大概经历过这些瞬间:文档切得太碎,答案失去上下文;切得太大,又召回不准;加了更多提示词,效果可能更不稳定。

来自主题: AI技术研报
6812 点击    2025-11-06 09:37
多智能体系统中,如何用向量数据库共享上下文?OpenAgents x Milvus

多智能体系统中,如何用向量数据库共享上下文?OpenAgents x Milvus

多智能体系统中,如何用向量数据库共享上下文?OpenAgents x Milvus

静态编排 VS 动态编排,谁是多agent系统最优解?通常来说,面对简单问题,采用react模式的单一agent就能搞定。可遇到复杂问题,单一agent就会立刻出现包括但不限于以下问题:串行执行效率低:无法同时完成并行的子步骤(如 “同时爬取 A、B 两个网站的数据”)。

来自主题: AI技术研报
7825 点击    2025-11-06 09:33
数字生命「培养皿」里,AI竟然学会了打架、结盟、抢地盘

数字生命「培养皿」里,AI竟然学会了打架、结盟、抢地盘

数字生命「培养皿」里,AI竟然学会了打架、结盟、抢地盘

一直以来,关于人工生命(Artificial Life, ALife)的研究致力于回答这样一个问题:生命的复杂性能否在计算系统中自然涌现?

来自主题: AI技术研报
7185 点击    2025-11-05 17:22
全球首个「导航大脑」上线!一句话让机器人自己找路回家

全球首个「导航大脑」上线!一句话让机器人自己找路回家

全球首个「导航大脑」上线!一句话让机器人自己找路回家

银河通用联合多所大学发布了全球首个跨本体全域环视导航基座大模型NavFoM,让机器人能自己找路,而不再依赖遥控,从而推动具身智能向规模化商业落地演进。

来自主题: AI技术研报
6296 点击    2025-11-05 17:20
具身智能一步踏入Scaling Law!10B+基础模型,27万小时真实数据

具身智能一步踏入Scaling Law!10B+基础模型,27万小时真实数据

具身智能一步踏入Scaling Law!10B+基础模型,27万小时真实数据

当前机器人领域,基础模型主要基于「视觉-语言预训练」,这样可将现有大型多模态模型的语义泛化优势迁移过来。但是,机器人的智能确实能随着算力和数据的增加而持续提升吗?我们能预测这种提升吗?

来自主题: AI技术研报
6374 点击    2025-11-05 16:42
清北联合推出Motion Transfer,比肩Gemini Robotics,让机器人直接从人类数据中端到端学习技能

清北联合推出Motion Transfer,比肩Gemini Robotics,让机器人直接从人类数据中端到端学习技能

清北联合推出Motion Transfer,比肩Gemini Robotics,让机器人直接从人类数据中端到端学习技能

近期,Google DeepMind 发布新一代具身大模型 Gemini Robotics 1.5,其核心亮点之一便是被称为 Motion Transfer Mechanism(MT)的端到端动作迁移算法 —— 无需重新训练,即可把不同形态机器人的技能「搬」到自己身上。不过,官方技术报告对此仅一笔带过,细节成谜。

来自主题: AI技术研报
8229 点击    2025-11-05 16:39
用更一致的轨迹、更少的解码步数「驯服」掩码扩散语言模型,扩散语言模型的推理性能和效率大幅提升

用更一致的轨迹、更少的解码步数「驯服」掩码扩散语言模型,扩散语言模型的推理性能和效率大幅提升

用更一致的轨迹、更少的解码步数「驯服」掩码扩散语言模型,扩散语言模型的推理性能和效率大幅提升

扩散大语言模型得到了突飞猛进的发展,早在 25 年 2 月 Inception Labs 推出 Mercury—— 第一个商业级扩散大型语言模型,同期人民大学发布第一个开源 8B 扩散大语言模型 LLaDA,5 月份 Gemini Diffusion 也接踵而至。

来自主题: AI技术研报
9252 点击    2025-11-05 15:17
AI太空竞赛?英伟达H100刚上天,谷歌Project Suncatcher也要将TPU送上天

AI太空竞赛?英伟达H100刚上天,谷歌Project Suncatcher也要将TPU送上天

AI太空竞赛?英伟达H100刚上天,谷歌Project Suncatcher也要将TPU送上天

11 月 2 日,英伟达首次把 H100 GPU 送入了太空,参阅报道《英伟达发射了首个太空 AI 服务器,H100 已上天》。而刚刚谷歌宣布,他们也要让 TPU 上天。

来自主题: AI技术研报
7578 点击    2025-11-05 15:15
震荡股市中的AI交易员:DeepSeek从从容容游刃有余? 港大开源一周8k星标走红

震荡股市中的AI交易员:DeepSeek从从容容游刃有余? 港大开源一周8k星标走红

震荡股市中的AI交易员:DeepSeek从从容容游刃有余? 港大开源一周8k星标走红

2025 年 10 月,美股经历了一轮典型的震荡行情:月初科技股强势反弹,月中通胀数据扰动市场,10 月 10 日前后纳指单日波动超过 3%。就在这波谲云诡的市场环境中,港大黄超教授团队的开源 AI-Trader 项目正式启动实盘测试。该项目上线一周时间在 GitHub 上获得了近 8K 星标,展现了社区对 AI 自主交易技术和金融市场分析的能力高度关注。

来自主题: AI技术研报
6541 点击    2025-11-05 10:28