AI技术研报-这里有最前沿的人工智能技术解读

高精度知识库≠Milvus+llm！这份PaddleOCR+混合检索+Rerank技巧请收好

在大型语言模型（LLM）的应用落地中，RAG（检索增强生成）是解决模型幻觉和知识时效性的关键技术。

来自主题: AI技术研报

10008 点击 2025-12-16 09:18

RL是「点金石」还是「挖掘机」？CMU 用可控实验给出答案

近期，强化学习（RL）技术在提升语言模型的推理能力方面取得了显著成效。

来自主题: AI技术研报

8993 点击 2025-12-16 09:17

国产芯片也能跑AI视频实时生成了，商汤Seko 2.0揭秘幕后黑科技

自 Sora 2 发布以来，各大科技厂商迎来新一轮视频生成模型「军备竞赛」，纷纷赶在年底前推出更强的迭代版本。

来自主题: AI技术研报

6759 点击 2025-12-16 09:15

狂揽162K Star！n8n 2.0强势来袭，这次改动有点狠。

大家好，我是继续研究n8n的袋鼠帝还记得我第一次给大家推荐n8n这款开源工作流自动化神器的时候吗（今年4月）

来自主题: AI技术研报

10824 点击 2025-12-15 16:43

AAAI 2026 | 革新电影配音工业流程：AI首次学会「导演-演员」配音协作模式

你是否也觉得，AI 配音的语调总是差了那么点 “人情味”？它能把台词念得字正腔圆，口型分秒不差，但角色的喜怒哀乐却总是难以触及灵魂深处。

来自主题: AI技术研报

10408 点击 2025-12-15 16:22

GPT-5准确率不足40%！北大发布多模态、高难度化学基准SUPERChem

北大团队发布化学大模型基准SUPERChem，这是一个多模态、高难度的化学推理基准。它针对现有化学评测的不足，系统构建了评估大语言模型化学推理能力的新体系。

来自主题: AI技术研报

9756 点击 2025-12-15 15:16

8B模型任务击败GPT-5？阶跃星辰开源Deep Think新框架，小模型解锁百万Token测试时计算

8B 模型在数学竞赛任务上超越 GPT-5！

来自主题: AI技术研报

10370 点击 2025-12-15 14:54

SIGGRAPH Asia 2025｜30FPS普通相机恢复200FPS细节，4D重建方案来了

当古装剧中的长袍在武林高手凌空翻腾的瞬间扬起 0.01 秒的惊艳弧度，当 VR 玩家想伸手抓住对手 “空中定格” 的剑锋，当 TikTok 爆款视频里一滴牛奶皇冠般的溅落要被 360° 无死角重放 —— 如何用普通的摄像机，把瞬间即逝的高速世界 “冻结” 成可供反复拆解、传送与交互的数字化 4D 时空，成为 3D 视觉领域的一个难题。

来自主题: AI技术研报

8779 点击 2025-12-15 14:50

24岁博士生造出空间AI大师G²VLM，让机器人眼明手快

近日，24 岁的 00 后博士生胡文博和所在团队造出一款名为 G²VLM 的超级 AI 模型，它是一位拥有空间超能力的视觉语言小能手，不仅能从普通的平面图片中精准地重建出三维世界，还能像人类一样进行复杂的空间思考和空间推理。

来自主题: AI技术研报

5879 点击 2025-12-15 14:49

「美国贴吧」被 AI 水军攻陷：为了证明是人类，2400 万用户被迫像傻瓜一样说话

「这是一项革命性的工作」、「不是……而是……」、「首先……其次……」；在一篇文章里读到这些词，你是不是本能地开始觉得，有点不对劲了。

来自主题: AI技术研报

10714 点击 2025-12-15 12:39

OpenAI突然开源新模型！99.9%的权重是0，新稀疏性方法代替MoE

破解AI胡说八道的关键，居然是给大模型砍断99.9%的连接线？

来自主题: AI技术研报

9682 点击 2025-12-15 12:20

暴涨3倍！18-34岁占比反降15%：这届中年人开始占领AI

如果说2023年是生成式AI的「出道年」，2024年是「炒作年」，那2025年，就是生成式AI真正走进普通人生活的「落地年」。

来自主题: AI技术研报

10310 点击 2025-12-15 12:14

6位前DeepMind老将打造「AI指挥官」，一半成本刷新SOTA

6位前DeepMind成员以元系统重塑大模型调用方式，该系统推出的Gemini 3 Pro优化技术在ARC-AGI-2上以54%的成绩夺得榜首，而成本仅为此前最优方法的一半。

来自主题: AI技术研报

8417 点击 2025-12-15 11:31

给AI装上细胞之眼：新框架CHMR破解药物研发数据缺失难题

近日，中山大学博士生李孟燃和中国科学院香港创新研究院臧泽林博士及合作者打造出一种名为 CHMR 的 AI 系统，堪比一位拥有细胞之眼的 AI 化学家，能让药物研发变得更精准和更安全。

来自主题: AI技术研报

6885 点击 2025-12-15 10:43

统一视觉多模态与多任务！快手可灵与港科大团队发布视频生成模型，加速真实世界理解

不仅能“听懂”物体的颜色纹理，还能“理解”深度图、人体姿态、运动轨迹……

来自主题: AI技术研报

8131 点击 2025-12-15 10:42

谢赛宁REPA得到大幅改进，只需不到4行代码

邹忌曾经有一个问题：吾与徐公孰美？

来自主题: AI技术研报

10174 点击 2025-12-15 10:39

全球强化学习+VLA范式，PI*0.6背后都有这家中国公司技术伏笔

在 Physical Intelligence 最新的成果 π0.6 论文里，他们介绍了 π0.6 迭代式强化学习的思路来源：

来自主题: AI技术研报

9067 点击 2025-12-15 09:58

AAAI 2026 Oral | 拒绝「一刀切」！AdaMCoT：让大模型学会「看题下菜碟」，动态选择最佳思考语言

多语言大模型（MLLM）在面对多语言任务时，往往面临一个选择难题：是用原来的语言直接回答，还是翻译成高资源语言去推理？

来自主题: AI技术研报

10165 点击 2025-12-15 09:53

NeurIPS 2025 | 告别全量扫描！浙大提出COIDO：破解多模态数据选择「高耗」难题

在深入技术细节之前，我们先用一张漫画来直观理解 COIDO (Coupled Importance-Diversity Optimization) 解决的核心问题与方案：正如钟离在漫画中所言，面对海量视觉指令数据的选择任务，传统方法需要遍历全部数据才能进行筛选造成大量「磨损」（高昂计算成本）。同时在面对数据重要性和多样性问题时，传统方法往往顾此失彼。

来自主题: AI技术研报

7182 点击 2025-12-14 10:46

苹果光速撤回RLAX论文：用了谷歌TPU和阿里Qwen，作者中还有庞若鸣

昨天，苹果一篇新论文在 arXiv 上公开然后又匆匆撤稿。原因不明。论文中，苹果揭示了他们开发的一个基于 TPU 的可扩展 RL 框架 RLAX。是的，你没有看错，不是 GPU，也不是苹果自家的 M 系列芯片，而是谷歌的 TPU！还不止如此，这篇论文的研究中还用到了亚马逊的云和中国的 Qwen 模型。

来自主题: AI技术研报

8417 点击 2025-12-13 11:08

港大开源ViMax火了，实现AI自编自导自演

想象一下，只需要一句话描述，AI 就能为你拍出一部完整的短剧？为了让这个想法变成现实，香港大学黄超教授团队开源了 ViMax 框架，并在 GitHub 获得 1.4k + 星标，专注于 Agentic Video Generation 的前沿探索。通过多智能体协作，ViMax 实现了真正的 "自编自导自演"—— 从创意构思到成片输出的完整自动化，把传统影视制作的每个环节都搬进了 AI 世界。

来自主题: AI技术研报

8987 点击 2025-12-13 11:06

多智能体一定比单智能体要好？Google最新研究：并非如此！

最近，来自Google Research、Google DeepMind和MIT的研究者们联合发表了一项重磅研究。结果显示：盲目增加智能体数量，在很多时候不仅没用，反而会让系统变笨、变慢、变贵。

来自主题: AI技术研报

7300 点击 2025-12-13 11:00

告别「盲目自信」，CCD：扩散语言模型推理新SOTA

扩散语言模型（Diffusion Language Models）以其独特的 “全局规划” 与并行解码能力广为人知，成为 LLM 领域的全新范式之一。然而在 Any-order 解码模式下，其通常面临

来自主题: AI技术研报

7669 点击 2025-12-13 10:59

a16z 提出 AI 产品的「水晶鞋效应」：第一批用户反而是最忠诚的

前几天，AI 推理服务供应商 OpenRouter 发布了一份报告《State of AI》，基于平台上 60 多家提供商的 300 多个模型，100 万亿个 token 的交互数据，对 LLM 的实际应用情况进行了分析。报告中，提到了一个「灰姑娘水晶鞋效应」，特别有意思。研究者在分析用户留用数据时发现一个现象：AI 模型发布第一个月进来的用户，往往比后来进来的用户留存率更高。

来自主题: AI技术研报

7994 点击 2025-12-12 16:15