AI技术研报-这里有最前沿的人工智能技术解读

B站正式开源AniSora V3：从单卡4090推理到导演驱动的多智能体动画生成

单台 8 卡 A800 仅需 8 秒即可生成 5 秒视频。

来自主题: AI技术研报

8329 点击 2025-09-11 19:02

交互扩展时代来临:创智复旦字节重磅发布AgentGym-RL，昇腾加持，开创智能体训练新范式

强化学习之父、2024 年 ACM 图灵奖得主 Richard Sutton 曾指出，人工智能正在迈入「经验时代」—— 在这个时代，真正的智能不再仅仅依赖大量标注数据的监督学习，而是来源于在真实环境中主动探索、不断积累经验的能力。

来自主题: AI技术研报

9175 点击 2025-09-11 18:53

她们估值840亿，刚发了第一个AI成果

刚刚，0产出估值就已冲破120亿美元的Thinking Machines，终于发布首篇研究博客。

来自主题: AI技术研报

7446 点击 2025-09-11 17:21

Jina Code Embeddings: 为高质量代码搜索而生的0.5B/1.5B向量模型

我们今天正式开源 jina-code-embeddings，一套全新的代码向量模型。包含 0.5B 和 1.5B 两种参数规模，并同步推出了 1-4 bit 的 GGUF 量化版本，方便在各类端侧硬件上部署。

来自主题: AI技术研报

11117 点击 2025-09-11 16:01

弃坑Claude！亲测CodeBuddy Code：单人2小时，从0搭建部署电商推荐系统

作为一名有着8年全栈开发经验的技术人员，我最近接手了一个具有挑战性的项目：为某中型服装电商平台开发一套智能商品推荐系统。该系统需要在2个月内完成，包含以下核心功能：

来自主题: AI技术研报

10519 点击 2025-09-11 12:42

谷歌AI新里程碑：一个能「做研究」的系统诞生了，用LLM+树搜索编写专家级软件

大模型在科研领域越来越高效了。

来自主题: AI技术研报

10190 点击 2025-09-11 11:40

快慢思考不用二选一！华为开源7B模型实现自由切，精度不变思维链减近50%

国产自研开源模型，让模型不用在快思考和慢思考间二选一了！

来自主题: AI技术研报

10023 点击 2025-09-11 11:24

真·博士水平！GPT-5首次给出第四矩定理显式收敛率，数学教授只点拨了一下

GPT-5真不愧是博士水平的AI！

来自主题: AI技术研报

6106 点击 2025-09-11 10:56

人人都能炼专属Agent，上海交大开源端侧Agent全栈工具链，真实场景性能超GPT-5！

打开手机，让 AI Agent 自动帮你完成订外卖、订酒店、网上购物的琐碎任务，这正成为智能手机交互的新范式。

来自主题: AI技术研报

8214 点击 2025-09-11 10:31

首个Data Agent基准测试来了！2007个测试任务将数据库、PDF、视频、音频异构数据源一网打尽

数据智能体到底好不好用？测评一下就知道了！

来自主题: AI技术研报

9680 点击 2025-09-11 10:18

CoRL 2025 | 港大InfoBodied AI团队首发具身表征新范式，构建任务自适应的感知框架

在具身智能中，策略学习通常需要依赖场景表征（scene representation）。然而，大多数现有多任务操作方法中的表征提取过程都是任务无关的（task-agnostic）：

来自主题: AI技术研报

10344 点击 2025-09-11 10:08

意识智能体：大模型的下一个进化方向？

机器具备意识吗？本文对AI意识（AI consciousness）进行了考察，特别是深入探讨了大语言模型作为高级计算模型实例是否具备意识，以及AI意识的必要和充分条件。

来自主题: AI技术研报

9837 点击 2025-09-11 09:55

=COPILOT()函数横空出世！AI自动写公式效率起飞，网友：让Excel再次伟大

苦等多年，Excel终于长大了！全新COPILOT函数神器，直接把AI塞进了表格，不论是整理数据、头脑风暴，还是分类反馈，通通一键搞定，打工人效率直接原地起飞。

来自主题: AI技术研报

10492 点击 2025-09-10 13:28

AlphaGo作者领衔，8个机械臂协同干活0碰撞，DeepMind新作登Science子刊

一群机械臂手忙脚乱地自己干活，彼此配合、互不碰撞。

来自主题: AI技术研报

10728 点击 2025-09-10 13:21

通用问题求解器雏形已现！谷歌DeepMind重磅研究，自主发现40种全新算法

在现代科学中，几乎所有领域都依赖软件来进行计算实验。但开发这些专用的科学软件是一个非常缓慢、乏味且困难的过程，开发和测试一个新想法（一次“试错”）需要编写复杂的软件，这个过程可能耗费数周、数月甚至数年。

来自主题: AI技术研报

10172 点击 2025-09-10 12:15

人类秒懂，AI崩溃：一个简单测试，就让GPT-5、Gemini等顶级模型集体“翻车”

人类一眼就能看懂的文字，AI居然全军覆没。

来自主题: AI技术研报

7651 点击 2025-09-10 12:00

从第一性原理出发的RAG推理新范式来了，蚂蚁DIVER登顶权威基准

在当前由大语言模型（LLM）驱动的技术范式中，检索增强生成（RAG）已成为提升模型知识能力与缓解「幻觉」的核心技术。然而，现有 RAG 系统在面对需多步逻辑推理任务时仍存在显著局限，具体挑战如下：

来自主题: AI技术研报

10320 点击 2025-09-10 11:07

Meta超级智能实验室首篇论文：重新定义RAG

Meta超级智能实验室的首篇论文，来了—— 提出了一个名为REFRAG的高效解码框架，重新定义了RAG（检索增强生成），最高可将首字生成延迟（TTFT）加速30倍。

来自主题: AI技术研报

9363 点击 2025-09-09 13:09

Claude Code的Sub-agents，烧了1000 美金才知道的血泪经验

自从 Claude code 上线 sub-agents 后，我一直对其抱很大的期待，每次做 case 都会搭建一支“AI coding 梦之队”。想象中，它们会在主 agent的协调下火力全开，完成我超级复杂的需求。

来自主题: AI技术研报

10514 点击 2025-09-09 11:27

从「会说」迈向「会做」，LLM下半场：Agentic强化学习范式综述

过去几年，大语言模型（LLM）的训练大多依赖于基于人类或数据偏好的强化学习（Preference-based Reinforcement Fine-tuning, PBRFT）：输入提示、输出文本、获得一个偏好分数。这一范式催生了 GPT-4、Llama-3 等成功的早期大模型，但局限也日益明显：缺乏长期规划、环境交互与持续学习能力。

来自主题: AI技术研报

9895 点击 2025-09-09 10:49

全流程国产GPU，上下文提速100倍！中国科学院发布「线性复杂度」类脑大模型

SpikingBrain借鉴大脑信息处理机制，具有线性/近线性复杂度，在超长序列上具有显著速度优势，在GPU上1M长度下TTFT 速度相比主流大模型提升26.5x， 4M长度下保守估计速度提升超过100x；

来自主题: AI技术研报

7191 点击 2025-09-09 10:25

不微调，让LLM推理准确率暴增到99%！试下DeepConf，一个轻量级推理框架｜Meta最新

在大型语言模型（LLM）进行数学题、逻辑推理等复杂任务时，一个非常流行且有效的方法叫做 “自洽性”（Self-Consistency），通常也被称为“平行思考”。

来自主题: AI技术研报

7365 点击 2025-09-09 10:17

开放全栈！超越π0，具身智能基础大模型迎来真·开源，开发者狂喜

继π0后，具身智能基座模型在中国也终于迎来了真正的开源—— 刚刚，WALL-OSS宣布正式开源！在多项指标中，它还超越了π0。如果你是搞具身的开发者，了解它的基本资料，你就一定不会想错过它：

来自主题: AI技术研报

7626 点击 2025-09-08 17:16

扎克伯格的豪赌初见成效？Meta新方法让LLM长上下文处理提速30倍

经历了前段时间的鸡飞狗跳，扎克伯格的投资似乎终于初见成效。

来自主题: AI技术研报

8062 点击 2025-09-08 16:30

斯坦福：优化器「诸神之战」？AdamW 凭「稳定」胜出

自2014 年提出以来，Adam 及其改进版 AdamW 长期占据开放权重语言模型预训练的主导地位，帮助模型在海量数据下保持稳定并实现较快收敛。

来自主题: AI技术研报

8332 点击 2025-09-08 16:18

具身VLA后训练：TeleAI提出潜空间引导的VLA跨本体泛化方法

在多模态大模型的基座上，视觉 - 语言 - 动作（Visual-Language-Action, VLA）模型使用大量机器人操作数据进行预训练，有望实现通用的具身操作能力。

来自主题: AI技术研报

7361 点击 2025-09-08 15:20

空间智能新高度：港科大谭平团队SAIL-Recon突破万帧级图像大规模3D场景重建Transformer

香港科技大学谭平教授团队与地平线（Horizon Robotics）团队最新发布了一项 3D 场景表征与大规模重建新方法 SAIL-Recon，通过锚点图建立构建场景全局隐式表征，突破现有 VGGT 基础模型对于大规模视觉定位与 3D 重建的处理能力瓶颈，实现万帧级的场景表征抽取与定位重建，将空间智能「3D 表征与建模」前沿推向一个新的高度。

来自主题: AI技术研报

8819 点击 2025-09-08 10:19