AI技术研报-这里有最前沿的人工智能技术解读

200美金，人人可手搓QwQ，清华、蚂蚁开源极速RL框架AReaL-boba

由于 DeepSeek R1 和 OpenAI o1 等推理模型（LRM，Large Reasoning Model）带来了新的 post-training scaling law，强化学习（RL，Reinforcement Learning）成为了大语言模型能力提升的新引擎。然而，针对大语言模型的大规模强化学习训练门槛一直很高：

来自主题: AI技术研报

9212 点击 2025-03-31 15:07

被LangChain折磨够了吗？试下100行代码打造的LLM有向图框架PocketFlow | 独家最新

你是否曾对着一个繁复的AI框架，无奈地想："真有必要搞得这么复杂吗？"在与臃肿框架斗争一年后，Zachary Huang博士决定大刀阔斧地革新，剔除所有花里胡哨的部分。于是Pocket Flow诞生了——一个仅有100行代码的超轻量级大语言模型框架！

来自主题: AI技术研报

8347 点击 2025-03-31 09:48

CVPR 2025 | EmoEdit：情感可编辑？深大VCC带你见证魔法！

当你翻开相册，看到一张平淡无奇的风景照，是否希望它能更温暖、更浪漫，甚至更忧郁？现在，EmoEdit 让这一切成为可能 —— 只需输入一个简单的情感词，EmoEdit 便能巧妙调整画面，使观众感知你想传递的情感。

来自主题: AI技术研报

9081 点击 2025-03-31 09:25

卷积网络又双叒叕行了？OverLoCK:一种仿生的卷积神经网络视觉基础模型

你是否注意过人类观察世界的独特方式？

来自主题: AI技术研报

2605 点击 2025-03-31 09:15

自动驾驶首次应用测试时计算！港大英伟达等新技术让AI边开边学，无人车遇变道自如应对

当开车遇到变道、加塞等场景时，驾驶员往往会下意识地激活自己的“安全驾驶思维”，从而做出激进的规避行为。

来自主题: AI技术研报

4813 点击 2025-03-31 09:07

AI「癌症神探」降临：准确度近100%，医生也自叹不如！

医学变革风暴来袭！ECgMPL模型如同医学领域的超级侦探，从细胞和组织微观图像里精准揪出癌症踪迹，诊断子宫内膜癌准确率近100%，远超医生平均水平。

来自主题: AI技术研报

5974 点击 2025-03-30 15:07

模型调优无需标注数据！将Llama 3.3 70B直接提升到GPT-4o水平

最近，AI 公司 Databricks 推出了一种新的调优方法 TAO，只需要输入数据，无需标注数据即可完成。更令人惊喜的是，TAO 在性能上甚至超过了基于标注数据的监督微调。

来自主题: AI技术研报

7138 点击 2025-03-30 14:33

网上晒图要当心！AI六成可能知道你在哪儿

给AI一张全新的照片，它能以相当高的准确率还猜出照片在哪个城市拍摄的。在新研究中，表现最好的AI模型，猜出图片所在城市的正确率比人类高62.6%！以后网上晒图可要当心了，AI可能知道你在哪里！

来自主题: AI技术研报

7868 点击 2025-03-30 14:23

一文读懂n8n：零基础玩转AI智能体，我该怎么选！与Coze(扣子)、Dify区别在哪？

疯哥收到最多的问题就是关于n8n与coze(扣子)、Dify有何不同，n8n和他们相比有什么优势？疯哥是资深n8n玩家，深知n8n能带给个人和企业多么强大的能力。但是，非常多的国内朋友从来都没听说过n8n，更不用提使用n8n为自己和企业搭建强大的AI自动化工作流。

来自主题: AI技术研报

9792 点击 2025-03-30 11:01

Adobe黑科技：视频扩散降维图像编辑，ObjectMover秒懂物理规律

论文第一作者为余鑫，香港大学三年级博士生，通讯作者为香港大学齐晓娟教授。主要研究方向为生成模型及其在图像和 3D 中的应用，发表计算机视觉和图形学顶级会议期刊论文数十篇，论文数次获得 Oral, Spotlight 和 Best Paper Honorable Mention 等荣誉。此项研究工作为作者于 Adobe Research 的实习期间完成。

来自主题: AI技术研报

7844 点击 2025-03-30 10:46

3D版DeepSeek卷起开源月：两大基础模型率先SOTA！又是VAST

3D生成版DeepSeek再上新高度！

来自主题: AI技术研报

7043 点击 2025-03-29 16:37

港大开源博士级AI智能体，独立完成三篇算法研究，一站式科研6小时搞定

这三篇论文，出自同一AI之手。

来自主题: AI技术研报

6916 点击 2025-03-29 16:13

专抓AI“看图说谎”，谷歌哥大用三类陷阱触发幻觉，打造可随技术发展动态演进的评估框架

幻觉（Hallucination），即生成事实错误或不一致的信息，已成为视觉-语言模型 (VLMs）可靠性面临的核心挑战。随着VLMs在自动驾驶、医疗诊断等关键领域的广泛应用，幻觉问题因其潜在的重大后果而备受关注。

来自主题: AI技术研报

5935 点击 2025-03-29 15:36

1.6万字Rankify完全指南：三行代码搞定RAG，24种重排序方法任你选 | 全网最详细。

继昨天《RAG太折磨人啦，试下pip install rankify，检索、重排序、RAG三合一，完美》发布之后，有许多朋友向我询问Rankify的具体使用方法和部署细节，尤其是生产环境如何处理自定义数据集和本地数据集。

来自主题: AI技术研报

5445 点击 2025-03-29 15:23

单张照片生成360°3D场景，支持灵活视角漫游｜人大&北师大&字节

从单张图像生成灵活视角3D场景的技术来了，在考古保护、自主导航等直接获取3D数据成本高昂或不可行的领域具有重要应用价值。

来自主题: AI技术研报

6002 点击 2025-03-29 14:34

VBench-2.0：面向视频生成新世代的评测框架

近一年以来，AI 视频生成技术发展迅猛。自 2024 年初 Sora 问世后，大家惊喜地发现：原来 AI 可以生成如此逼真的视频，一时间各大高校实验室、互联网巨头 AI Lab 以及创业公司纷纷入局视频生成领域。

来自主题: AI技术研报

5969 点击 2025-03-29 14:13

《连线》杂志长文：疯狂追赶OpenAI的2年，谷歌都做了什么？

AGI的这两年，基本OpenAI压着谷歌打的两年，包括但不限于谷歌自己的失误、每次发布会的被截胡。比如这次Gemini 2.5 Pro 被 4o图片生成功能抢走了几乎所有关注点。但谷歌确实也在一直追赶，从最开始的措手不及，到现在已经开始有来有往。著名科技杂志《连线》采访了谷歌前和现员工超50人，发布了一篇长文，深度挖掘了谷歌这两年苦苦追赶Openai的内幕故事，

来自主题: AI技术研报

6982 点击 2025-03-29 14:01

CVPR 2025高分论文：从照片重建3D矢量，告别模糊渲染，重建边缘更清晰

三维高斯泼溅（3D Gaussian Splatting, 3DGS）技术基于高斯分布的概率模型叠加来表征场景，但其重建结果在几何和纹理边界处往往存在模糊问题。

来自主题: AI技术研报

8047 点击 2025-03-29 13:40

3D基础模型时代开启？Meta与牛津大学推出VGGT，一站式Transformer开创高效3D视觉新范式

「仅需一次前向推理，即可预测相机参数、深度图、点云与 3D 轨迹 ——VGGT 如何重新定义 3D 视觉？」

来自主题: AI技术研报

6389 点击 2025-03-29 13:31

17款大模型PK八款棋牌游戏，o3-mini胜出，DeepSeek R1输在中间步骤

AI社区掀起用大模型玩游戏之风！例如国外知名博主让DeepSeek和Chatgpt下国际象棋的视频在Youtube上就获得百万播放，ARC Prize组织最近也发布了一个贪吃蛇LLM评测基准SnakeBench。

来自主题: AI技术研报

7834 点击 2025-03-29 10:19

3D领域DeepSeek「源神」启动！国产明星创业公司，一口气开源八大项目

3 月 28 日，专注于构建通用 3D 大模型的 VAST 一口气开源了两个 3D 生成项目 ——TripoSG 和 TripoSF。前者是一款基础 3D 生成模型，在图像到 3D 生成任务上远超所有闭源模型；后者则是 VAST 新一代三维基础模型 TripoSF 能在所有闭源模型中同样取得 SOTA 的基础组件，用于高分辨率的三维重建和生成任务。

来自主题: AI技术研报

7705 点击 2025-03-29 09:39