AI技术研报-这里有最前沿的人工智能技术解读

谢赛宁等新作上线，多模态理解生成大一统！思路竟与GPT-4o相似？

来自Meta和NYU的团队，刚刚提出了一种MetaQuery新方法，让多模态模型瞬间解锁多模态生成能力！令人惊讶的是，这种方法竟然如此简单，就实现了曾被认为需要MLLM微调才能具备的能力。

来自主题: AI技术研报

7429 点击 2025-04-13 14:11

GitHub Copilot 加入基于 AI 的代码密码扫描功能

GitHub 在其 Copilot 功能中引入了一项基于 AI 的密码扫描功能，该功能已经整合到 GitHub Secret Protection 中。

来自主题: AI技术研报

7693 点击 2025-04-13 13:36

杜蕾斯级别的创意海报，现在你用即梦3.0就能批量生了

如果你没有杜蕾斯背后强大的5A广告公司、鬼才般的创意团队、句句封神的的金牌文案、审美爆辣的视觉艺术家。借助即梦刚上线的3.0生图模型以及 Deepseek生创意和文案，你也可以轻松复刻一个「杜蕾斯级别」的刷屏海报。

来自主题: AI技术研报

8527 点击 2025-04-13 10:12

魔改AlphaZero后，《我的世界》AI老玩家问世，干活不用下指令

人和智能体共享奖励参数，这才是强化学习正确的方向？

来自主题: AI技术研报

7972 点击 2025-04-12 21:59

4090玩转大场景几何重建，RGB渲染和几何精度达SOTA｜上海AI Lab&西工大新研究

仅用4090就能实现大规模城市场景重建！

来自主题: AI技术研报

6426 点击 2025-04-12 14:56

手机实现GPT级智能，比MoE更极致的稀疏技术：省内存效果不减｜对话面壁&清华肖朝军

在大模型争霸的时代，算力与效率的平衡成为决定胜负的关键。

来自主题: AI技术研报

9154 点击 2025-04-12 14:38

AI Agent 摩尔定律：每7个月能力翻倍，带来软件智能大爆炸

AI Agent 领域也存在 scaling law，甚至还在加速。

来自主题: AI技术研报

9048 点击 2025-04-12 14:11

失败 AI 产品列表

简单分享一份下线 AI 产品的信息列表（AI Graveyard），里面囊括的产品小类非常多。

来自主题: AI技术研报

7604 点击 2025-04-12 13:47

传统预训练正走向终结，推理优化与后训练提升有限，大模型今后如何突破发展瓶颈？

高质量数据枯竭，传统预训练走向终点，大模型如何突破瓶颈？

来自主题: AI技术研报

6503 点击 2025-04-12 13:42

让机器人更像人类有了新方法！港科大新算法对齐人机动作形态，无需重复训练，轻量模块通用且适配

“让机器人看懂世界、听懂指令、动手干活”正从科幻走向现实。

来自主题: AI技术研报

7523 点击 2025-04-12 13:22

移动端AI安全再突破！水印保护新范式：403个AI App成功保护率超8成

随着智能手机和物联网设备普及，移动端AI成为趋势，带来离线运行、低延迟、隐私保护等优势。然而，模型本地存储同时带来了严重风险。

来自主题: AI技术研报

7848 点击 2025-04-12 13:00

200B参数击败满血DeepSeek-R1，字节豆包推理模型Seed-Thinking-v1.5要来了

字节跳动豆包团队今天发布了自家新推理模型 Seed-Thinking-v1.5 的技术报告。从报告中可以看到，这是一个拥有 200B 总参数的 MoE 模型，每次工作时会激活其中 20B 参数。其表现非常惊艳，在各个领域的基准上都超过了拥有 671B 总参数的 DeepSeek-R1。有人猜测，这就是字节豆包目前正在使用的深度思考模型。

来自主题: AI技术研报

8225 点击 2025-04-11 16:01

IC-Light的视频版本来了，RelightVid：强光动态环境下的视频光照编辑神器

大家还记得那个 ICLR 2025 首次满分接收、彻底颠覆静态图像光照编辑的工作 IC-Light 吗？

来自主题: AI技术研报

7429 点击 2025-04-11 14:51

SemiAnalysis大研报：Tariff → AI

报告深入分析了特朗普总统于2025年4月2日宣布的“解放日”关税措施对美国人工智能（AI）基础设施建设、相关供应链以及全球贸易格局的潜在影响。

来自主题: AI技术研报

7277 点击 2025-04-11 14:44

RAG技术演进的四大核心命题【阿里官方对RAG的理解认知】

随着技术的深入应用，如何高效利用大模型技术优化用户体验，同时应对其带来的诸多挑战？本文将从RAG的发展趋势、技术挑战、核心举措以及未来展望四个维度总结我们应对挑战的新的思路和方法。

来自主题: AI技术研报

10201 点击 2025-04-11 13:55

DeepSeek+开源n8n：24h推特(X)热点监控Workflow太绝了！【附赠：完整工作流文件】

前两天给大家分享了一个我认为最强的开源AI Workflow平台：n8n。经过这几天的研究，我用n8n实现了一套超实用的X（原Twitter）热点监控workflow（工作流）。它由两个workflow(工作流)组成

来自主题: AI技术研报

12086 点击 2025-04-11 10:27

7B小模型写好学术论文，新框架告别AI引用幻觉，实测100%学生认可引用质量

学术写作通常需要花费大量精力查询文献引用，而以ChatGPT、GPT-4等为代表的通用大语言模型（LLM）虽然能够生成流畅文本，但经常出现“引用幻觉”（Citation Hallucination），即模型凭空捏造文献引用。这种现象严重影响了学术论文的可信度与专业性。

来自主题: AI技术研报

8761 点击 2025-04-11 10:20

流体力学专用版DeepSeek，单GPU可跑，成本节约高达100倍

又一专业领域成功引入AI工程师！

来自主题: AI技术研报

8318 点击 2025-04-11 10:00

CVPR 2025 | 2D 大模型赋能3D Affordance 预测，GEAL助力可泛化的3D场景可交互区域识别

在现实世界中，如何让智能体理解并挖掘 3D 场景中可交互的部位（Affordance）对于机器人操作与人机交互至关重要。所谓 3D Affordance Learning，就是希望模型能够根据视觉和语言线索，自动推理出物体可供哪些操作、以及可交互区域的空间位置，从而为机器人或人工智能系统提供对物体潜在操作方式的理解。

来自主题: AI技术研报

5528 点击 2025-04-11 09:55

预训练还没终结！港中文清华等提出「三位一体」框架，持续自我进化

港中文、清华等高校提出SICOG框架，通过预训练、推理优化和后训练协同，引入自生成数据闭环和结构化感知推理机制，实现模型自我进化，为大模型发展提供新思路。

来自主题: AI技术研报

8778 点击 2025-04-11 09:36

闭环端到端精度暴涨19.61%！华科&小米汽车联手打造自动驾驶框架ORION，代码将开源

近年来，端到端（End-to-End，E2E）自动驾驶技术不断进步，但在复杂的闭环交互环境中，由于其因果推理能力有限，仍然难以做出准确决策。虽然视觉 - 语言大模型（Vision-Language Model，VLM）凭借其卓越的理解和推理能力，为端到端自动驾驶带来了新的希望，但现有方法在 VLM 的语义推理空间和纯数值轨迹的行动空间之间仍然存在巨大鸿沟。

来自主题: AI技术研报

7988 点击 2025-04-11 09:28

AI优化芯片布局，设计阶段即考虑最终性能，中科大华为诺亚新方法入选ICLR 2025 Oral

用AI指导芯片设计，中科大王杰教授团队、华为诺亚实验室、天津大学提出全新芯片宏单元布局优化方法LaMPlace！

来自主题: AI技术研报

7366 点击 2025-04-11 08:47

Kimi 16B胜GPT-4o！开源视觉推理模型：MoE架构，推理时仅激活2.8B

刚刚，Kimi团队上新了！

来自主题: AI技术研报

7711 点击 2025-04-10 16:25

字节开源新生图模型：一个模型统一所有生图任务，多主体融合效果SOTA

利用字节团队魔改的FLUX模型，可以直接把多个参考主体放进一张图了。

来自主题: AI技术研报

8400 点击 2025-04-10 15:15

5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持

谷歌Deep Research重大升级，搭载全球顶尖Gemini 2.5 Pro模型。5分钟生成46页学术论文、复杂报告转为10分钟播客。性能超OpenAI DR 40%，价格仅为其1/10。

来自主题: AI技术研报

6578 点击 2025-04-10 12:26

李飞飞团队提出世界模型基准：“世界生成”能力迎来统一评测，3D/4D/视频模型同台PK

世界模型领域最新进展，要比拼“世界生成”了。

来自主题: AI技术研报

10506 点击 2025-04-10 12:15

UC伯克利华人开源14B「o3-mini」，代码版R1突袭OpenAI王座！

OpenAI o1/o3-mini级别的代码推理模型竟被抢先开源！UC伯克利和Together AI联合推出的DeepCoder-14B-Preview，仅14B参数就能媲美o3-mini，开源代码、数据集一应俱全，免费使用。

来自主题: AI技术研报

8549 点击 2025-04-10 11:52

字节最新人像视频生成模型DreamActor-M1，推特关注超百万！即梦AI即将上线

自数字人技术Omnihuman-1引起行业关注之后，字节智能创作团队再放大招。全新DreamActor-M1横空出世，一张照片一段视频，就能生成电影级视频，精准迁移表情动作，还支持多种画风。

来自主题: AI技术研报

10794 点击 2025-04-10 11:12

芯片设计效率提升2.5倍，中科大华为诺亚联合，用GNN+蒙特卡洛树搜索优化电路设计 | ICLR2025

芯片设计是现代科技的核心，逻辑优化（Logic Optimization, LO）作为芯片设计流程中的关键环节，其效率直接影响着芯片设计的整体性能。

来自主题: AI技术研报

4247 点击 2025-04-10 11:03

孪生世界动态仿真新突破！北大发布RainyGS：降雨/洪涝/风速精准可控

北京大学陈宝权教授团队提出RainyGS技术，通过结合物理模拟和3D高斯泼溅渲染框架，实现了真实场景中动态雨效的高质量仿真与呈现，真正实现「从真实到真实」，或者「以仿真乱真」，即Real2Sim2Real ！相比现有的视频编辑工具（如 Runway），其物理真实性获得保证。

来自主题: AI技术研报

8371 点击 2025-04-10 10:51

AI技术研报-这里有最前沿的人工智能技术解读

谢赛宁等新作上线，多模态理解生成大一统！思路竟与GPT-4o相似？

GitHub Copilot 加入基于 AI 的代码密码扫描功能

杜蕾斯级别的创意海报，现在你用即梦3.0就能批量生了

魔改AlphaZero后，《我的世界》AI老玩家问世，干活不用下指令

4090玩转大场景几何重建，RGB渲染和几何精度达SOTA｜上海AI Lab&西工大新研究

手机实现GPT级智能，比MoE更极致的稀疏技术：省内存效果不减｜对话面壁&清华肖朝军

AI Agent 摩尔定律：每7个月能力翻倍，带来软件智能大爆炸

失败 AI 产品列表

传统预训练正走向终结，推理优化与后训练提升有限，大模型今后如何突破发展瓶颈？

让机器人更像人类有了新方法！港科大新算法对齐人机动作形态，无需重复训练，轻量模块通用且适配

移动端AI安全再突破！水印保护新范式：403个AI App成功保护率超8成

200B参数击败满血DeepSeek-R1，字节豆包推理模型Seed-Thinking-v1.5要来了

IC-Light的视频版本来了，RelightVid：强光动态环境下的视频光照编辑神器

SemiAnalysis大研报：Tariff → AI

RAG技术演进的四大核心命题【阿里官方对RAG的理解认知】

DeepSeek+开源n8n：24h推特(X)热点监控Workflow太绝了！【附赠：完整工作流文件】

7B小模型写好学术论文，新框架告别AI引用幻觉，实测100%学生认可引用质量

流体力学专用版DeepSeek，单GPU可跑，成本节约高达100倍

CVPR 2025 | 2D 大模型赋能3D Affordance 预测，GEAL助力可泛化的3D场景可交互区域识别

预训练还没终结！港中文清华等提出「三位一体」框架，持续自我进化

闭环端到端精度暴涨19.61%！华科&小米汽车联手打造自动驾驶框架ORION，代码将开源

AI优化芯片布局，设计阶段即考虑最终性能，中科大华为诺亚新方法入选ICLR 2025 Oral

Kimi 16B胜GPT-4o！开源视觉推理模型：MoE架构，推理时仅激活2.8B

字节开源新生图模型：一个模型统一所有生图任务，多主体融合效果SOTA​

5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持

李飞飞团队提出世界模型基准：“世界生成”能力迎来统一评测，3D/4D/视频模型同台PK

UC伯克利华人开源14B「o3-mini」，代码版R1突袭OpenAI王座！

字节最新人像视频生成模型DreamActor-M1，推特关注超百万！即梦AI即将上线

芯片设计效率提升2.5倍，中科大华为诺亚联合，用GNN+蒙特卡洛树搜索优化电路设计 | ICLR2025

孪生世界动态仿真新突破！北大发布RainyGS：降雨/洪涝/风速精准可控

字节开源新生图模型：一个模型统一所有生图任务，多主体融合效果SOTA