AI技术研报-这里有最前沿的人工智能技术解读

embedding分数不是唯一解！搜索场景，如何根据元数据做加权rerank

今天聊一聊我们如何做高质量rerank。

来自主题: AI技术研报

10093 点击 2025-12-18 09:43

大模型的进化方向：Words to Worlds | 对话商汤林达华

李飞飞团队最新的空间智能模型Cambrian-S，首次被一个国产开源AI超越了。

来自主题: AI技术研报

6770 点击 2025-12-18 09:15

刷榜自动驾驶语义场景补全！北大新作：高维度、高密度 | AAAI'26

北京大学团队提出了一种新的视觉语义场景补全方法HD²-SSC，用于从多视角图像重建三维语义场景。该方法通过高维度语义解耦和高密度占用优化，解决了现有技术中二维输入与三维输出之间的维度差异，以及人工标注与真实场景密度差异的问题，从而实现更准确的语义场景补全。

来自主题: AI技术研报

6413 点击 2025-12-18 09:14

比LoRA更快更强，全新框架LoFA上线，秒级适配大模型

在个性化视觉生成的实际应用中，通用视觉基础模型的表现往往难以满足精准需求。为实现高度定制化的生成效果，通常需对大模型进行针对性的自适应微调，但当前以 LoRA 为代表的主流方法，仍受限于定制化数据收集与冗长的优化流程，耗时耗力，难以在真实场景中广泛应用。

来自主题: AI技术研报

6394 点击 2025-12-18 09:12

60秒极限挑战！中国GPU独角兽杀出重围，斩获图形顶会大奖

他们不光能造GPU，还能写出全球顶级的算法！摩尔线程这次开源给国产具身智能递了一把「神兵利器」。

来自主题: AI技术研报

10493 点击 2025-12-18 09:09

给Agent装上“海马体”！上海AILab开源MemVerse，定义多模态记忆新范式

一页纯文本的记忆是看不清世界的。

来自主题: AI技术研报

7506 点击 2025-12-17 14:59

所有大模型，都学物理学：北大物理系一篇研究，震撼了AI圈

LLM 智能体很赞，正在成为一种解决复杂难题的强大范式。

来自主题: AI技术研报

8478 点击 2025-12-17 14:58

VGGT4D：无需训练，挖掘3D基础模型潜力，实现4D动态场景重建

如何让针对静态场景训练的 3D 基础模型（3D Foundation Models）在不增加训练成本的前提下，具备处理动态 4D 场景的能力？

来自主题: AI技术研报

7269 点击 2025-12-17 14:38

小米突然发布新模型：媲美 DeepSeek-V3.2，把手机的性价比卷到 AI

开源模型再次迎来一位重磅选手，就在刚刚，小米正式发布并开源新模型 MiMo-V2-Flash。

来自主题: AI技术研报

9937 点击 2025-12-17 11:52

高保真、多控制集成于「统一画布」，组合式图像生成新范式！

Canvas-to-Image 是一种新型图像生成框架，将多种控制方式（如身份、姿态、空间布局）整合到一个统一画布中，用户可通过直观操作生成高保真、多控制的图像。它简化了创作流程，让用户在单一界面完成复杂创作，为AI创作工具提供了新范式。

来自主题: AI技术研报

6958 点击 2025-12-17 10:27

56倍加速生成式策略：西交大提出EfficientFlow，迈向高效具身智能

生成式模型正在成为机器人和具身智能领域的重要范式，它能够从高维视觉观测中直接生成复杂、灵活的动作策略，在操作、抓取等任务中表现亮眼。但在真实系统中，这类方法仍面临两大「硬伤」：一是训练极度依赖大规模演示数据，二是推理阶段需要大量迭代，动作生成太慢，难以实时控制。

来自主题: AI技术研报

5775 点击 2025-12-17 09:55

中国科学家用AI造出不怕开水的蛋白质，无惧150℃高温，比肌肉强韧4倍

近日，南京大学教授郑鹏和团队造出一种全新的超级蛋白质，不仅比人体肌肉组织里的天然蛋白质坚韧 4 倍以上，而且还能在开水里安然无恙，甚至能够承受 150℃ 的高温，这打破了人们对于蛋白质怕热的固有印象。蛋白质的机械强度被人工设计提升到纳牛顿的级别，堪比自然界已知的最坚韧的一些分子相互作用。

来自主题: AI技术研报

9143 点击 2025-12-17 09:23

浙大联手字节：开源大规模指令跟随视频编辑数据集OpenVE-3M

作者提出了一个大规模、高质量、多类别的指令跟随的视频编辑数据集 OpenVE-3M，共包含 3M 样本对，分为空间对齐和非空间对齐 2 大类别共 8 小类别。

来自主题: AI技术研报

7370 点击 2025-12-17 09:22

AI Agent最新「Memory」综述｜多所顶尖机构联合发布

就在昨天，新加坡国立大学、中国人民大学、复旦大学等多所顶尖机构联合发布了一篇AI Agent 记忆（Memory）综述。

来自主题: AI技术研报

8389 点击 2025-12-17 09:21

临床PK完胜ChatGPT-5！国内团队造出首个OCT影像AI系统

通用大模型（LLM）的狂飙突进，终于在医疗垂直领域的「最后一公里」撞上了硬墙。虽然 ChatGPT 在 USMLE（美国执业医师资格考试）中表现优异，但在面对需要「火眼金睛」和「毫厘必争」的心脏手术台上，通用大模型的表现究竟如何？

来自主题: AI技术研报

8404 点击 2025-12-16 17:23

英伟达开源发布最新AI模型！引入突破性专家混合架构，推理性能超越Qwen3和GPT，百万token上下文，模型数据集全开源！

就在刚刚，英伟达正式开源发布了其新一代AI模型：NVIDIA Nemotron 3。Nemotron 3 系列由三种型号组成：Nano、Super 和 Ultra。官方介绍其具备强大的智能体、推理和对话能力。

来自主题: AI技术研报

9387 点击 2025-12-16 17:21

Thinking Machines首款产品重大更新：K2 Thinking、Qwen3-VL都可以微调了

当前，AI 领域的研究者与开发者在关注 OpenAI、Google 等领先机构最新进展的同时，也将目光投向了由前 OpenAI CTO Mira Murati 创办的 Thinking Machines Lab。

来自主题: AI技术研报

6067 点击 2025-12-16 16:31

让扩散模型「可解释」不再降质，开启图片编辑新思路

过去三年，扩散模型席卷图像生成领域。以 DiT (Diffusion Transformer) 为代表的新一代架构不断刷新图像质量的极限，让模型愈发接近真实世界的视觉规律。

来自主题: AI技术研报

7776 点击 2025-12-16 16:27

医疗AI迎来大考！南洋理工发布首个LLM电子病历处理评测 | AAAI'26

南洋理工大学研究人员构建了EHRStruct基准，用于评测LLM处理结构化电子病历的能力。该基准涵盖11项核心任务，包含2200个样本，按临床场景、认知层级和功能类别组织。研究发现通用大模型优于医学专用模型，数据驱动任务表现更强，输入格式和微调方式对性能有显著影响。

来自主题: AI技术研报

10234 点击 2025-12-16 16:27

RL是「点金石」还是「挖掘机」？CMU 用可控实验给出答案

近期，强化学习（RL）技术在提升语言模型的推理能力方面取得了显著成效。

来自主题: AI技术研报

6549 点击 2025-12-16 16:26

Veo何止生成视频：DeepMind正在用它模拟整个机器人世界

随着通用型（Generalist）机器人策略的发展，机器人能够通过自然语言指令在多种环境中完成各类任务，但这也带来了显著的挑战。

来自主题: AI技术研报

10201 点击 2025-12-16 14:39

阿里妈妈发布MUSE：用多模态搞定十万级超长行为序列，并开源Taobao-MM数据集

如果把用户在互联网上留下的每一个足迹都看作一段记忆，那么现在的推荐系统大多患有 “短期健忘症”。

来自主题: AI技术研报

9521 点击 2025-12-16 14:38

推特吵架吵出篇论文！谢赛宁团队新作iREPA只要3行代码

要说真学术，还得看推特。

来自主题: AI技术研报

6497 点击 2025-12-16 14:37

1100多个模型殊途同归，指向一个「通用子空间」，柏拉图又赢一回？

模型架构的重要性可能远超我们之前的认知。

来自主题: AI技术研报

8640 点击 2025-12-16 14:36

用Nano Banana做PPT爆火，开源项目狂揽3K+星标！

前有 vibe coding ，随着 nano banana 升级 pro， vibe PPT 也跟着来了。最近我在 GitHub 上挖到一个项目：banana slides 。这是一个基于 nano banana pro 的原生 AI PPT 生成应用。

来自主题: AI技术研报

10960 点击 2025-12-16 10:42

全网破防，AI「手指难题」翻车逼疯人类！6根手指，暴露Transformer致命缺陷

最近，网友们已经被AI「手指难题」逼疯了。给AI一支六指手，它始终无法正确数出到底有几根手指！说吧AI，你是不是在嘲笑人类？其实这背后，暗藏着Transformer架构的「阿喀琉斯之踵」……

来自主题: AI技术研报

6730 点击 2025-12-16 10:37

Prompt、Context engineering 又向前进化了，3个关键维度+5个具体杠杆｜谷歌

我们正处在一个AI Agent（智能体）爆发的时代。从简单的ReAct循环到复杂的Multi-Agent Swarm（多智能体蜂群），新的架构层出不穷。但在这些眼花缭乱的名词背后，开发者的工作往往更像是一门“玄学”，我们凭直觉调整提示词，凭经验增加Agent的数量，却很难说清楚为什么某个架构在特定任务上表现更好。

来自主题: AI技术研报

8425 点击 2025-12-16 09:59

AI模型价格下降1000倍，为什么我们支出的成本没有随之降低？

2025年12月12日，波士顿大学的 Andrey Fradkin 团队发布了一项令业界瞩目的研究《The Emerging Market for Intelligence: Pricing, Supply, and Demand for LLMs》（智能的新兴市场：LLM的定价、供给与需求）。

来自主题: AI技术研报

8484 点击 2025-12-16 09:58

无预训练模型拿下ARC-AGI榜三！Mamba作者用压缩原理挑战Scaling Law

压缩即智能，又有新进展！

来自主题: AI技术研报

8986 点击 2025-12-16 09:56

NeurIPS 2025｜指哪打哪，可控对抗样本生成器来了！

近日，在全球人工智能领域最具影响力的顶级学术会议 NeurIPS（神经信息处理系统大会）上，清华大学和蚂蚁数科联合提出了一种名为 Dual-Flow 的新型对抗攻击生成框架。

来自主题: AI技术研报

6690 点击 2025-12-16 09:55

AI技术研报-这里有最前沿的人工智能技术解读

embedding分数不是唯一解！搜索场景，如何根据元数据做加权rerank

大模型的进化方向：Words to Worlds | 对话商汤林达华

刷榜自动驾驶语义场景补全！北大新作：高维度、高密度 | AAAI'26

比LoRA更快更强，全新框架LoFA上线，秒级适配大模型

60秒极限挑战！中国GPU独角兽杀出重围，斩获图形顶会大奖

给Agent装上“海马体”！上海AILab开源MemVerse，定义多模态记忆新范式

所有大模型，都学物理学：北大物理系一篇研究，震撼了AI圈

VGGT4D：无需训练，挖掘3D基础模型潜力，实现4D动态场景重建

小米突然发布新模型：媲美 DeepSeek-V3.2，把手机的性价比卷到 AI

高保真、多控制集成于「统一画布」，组合式图像生成新范式！

56倍加速生成式策略：西交大提出EfficientFlow，迈向高效具身智能

中国科学家用AI造出不怕开水的蛋白质，无惧150℃高温，比肌肉强韧4倍

浙大联手字节：开源大规模指令跟随视频编辑数据集OpenVE-3M

AI Agent最新「Memory」综述 ｜多所顶尖机构联合发布

临床PK完胜ChatGPT-5！国内团队造出首个OCT影像AI系统

英伟达开源发布最新AI模型！引入突破性专家混合架构，推理性能超越Qwen3和GPT，百万token上下文，模型数据集全开源！

Thinking Machines首款产品重大更新：K2 Thinking、Qwen3-VL都可以微调了

让扩散模型「可解释」不再降质，开启图片编辑新思路

医疗AI迎来大考！南洋理工发布首个LLM电子病历处理评测 | AAAI'26

RL是「点金石」还是「挖掘机」？CMU 用可控实验给出答案

Veo何止生成视频：DeepMind正在用它模拟整个机器人世界

阿里妈妈发布MUSE：用多模态搞定十万级超长行为序列，并开源Taobao-MM数据集

推特吵架吵出篇论文！谢赛宁团队新作iREPA只要3行代码

1100多个模型殊途同归，指向一个「通用子空间」，柏拉图又赢一回？

用Nano Banana做PPT爆火，开源项目狂揽3K+星标！

全网破防，AI「手指难题」翻车逼疯人类！6根手指，暴露Transformer致命缺陷

Prompt、Context engineering 又向前进化了，3个关键维度+5个具体杠杆 ｜谷歌

AI模型价格下降1000倍，为什么我们支出的成本没有随之降低？

无预训练模型拿下ARC-AGI榜三！Mamba作者用压缩原理挑战Scaling Law

NeurIPS 2025｜指哪打哪，可控对抗样本生成器来了！

AI Agent最新「Memory」综述｜多所顶尖机构联合发布

Prompt、Context engineering 又向前进化了，3个关键维度+5个具体杠杆｜谷歌