AI技术研报-这里有最前沿的人工智能技术解读

OpenAI新研究：o1增加推理时间就能防攻击，网友：DeepSeek也受益

OpenAI的新Scaling Law，含金量又提高了。

来自主题: AI技术研报

5986 点击 2025-01-24 15:00

会用ChatGPT≠工程师，谷歌资深员工发文，揭秘AI编程不为人知的真相

苏格拉底曾提到的门诺悖论（Meno's paradox）认为，人只能学会自己已经知道的事情；而关于AI辅助编程，谷歌资深工程师最近的一篇博客告诉我们，类似的知识悖论同样存在。

来自主题: AI技术研报

6763 点击 2025-01-24 14:54

用慢思考提升模型安全性，北交大、鹏城实验室提出系统2对齐

OpenAI 在 “双十二” 发布会的最后一天公开了 o 系列背后的对齐方法 - deliberative alignment，展示了通过系统 2 的慢思考能力提升模型安全性的可行性。

来自主题: AI技术研报

7024 点击 2025-01-24 14:45

无需微调，只靠Prompt，搞定LLM持续学习CL新范式，COLING2025（附提示词）

未来，掌握持续提示工程技术的开发者，将主导下一代智能系统的进化方向。

来自主题: AI技术研报

8049 点击 2025-01-24 14:33

高效Attention引擎是怎样炼成的？陈天奇团队FlashInfer打响新年第一枪！

新年第一天，陈天奇团队的FlashInfer论文出炉！块稀疏、可组合、可定制、负载均衡......更快的LLM推理技术细节全公开。

来自主题: AI技术研报

6459 点击 2025-01-24 13:58

不断用AI自己生成的内容去喂它，你猜怎么着？

ChatGPT等聊天机器人背后的算法能从各种各样的网络文本中抓取万亿字节的素材，文本来源可以是网络文章，也可以是社媒平台的帖子，还可以是视频里的字幕或评论。

来自主题: AI技术研报

3874 点击 2025-01-24 13:13

DeepSeek新模型大揭秘，为何它能震动全球AI圈

时隔不到一个月，DeepSeek又一次震动全球AI圈。去年 12 月，DeepSeek推出的DeepSeek-V3在全球AI领域掀起了巨大的波澜，它以极低的训练成本，实现了与GPT-4o和Claude Sonnet 3.5等顶尖模型相媲美的性能，震惊了业界。

来自主题: AI技术研报

5595 点击 2025-01-24 13:05

UC伯克利等提出具身智能「动作Tokenizer」，效率飙升5倍！

研究者提出了FAST，一种高效的动作Tokenizer。通过结合离散余弦变换（DCT）和字节对编码（BPE），FAST显著缩短了训练时间，并且能高效地学习和执行复杂任务，标志着机器人自回归Transformer训练的一个重要突破。

来自主题: AI技术研报

7175 点击 2025-01-23 13:19

化解机器人的「幻觉」：北大发布OmniManip，VLM结合双闭环系统，3D理解能力大幅提升

近年来视觉语⾔基础模型（Vision Language Models, VLMs）在多模态理解和⾼层次常识推理上⼤放异彩，如何将其应⽤于机器⼈以实现通⽤操作是具身智能领域的⼀个核⼼问题。这⼀⽬标的实现受两⼤关键挑战制约：

来自主题: AI技术研报

7209 点击 2025-01-23 13:09

20K合成数据就能让大模型能力飙升！还能实现模型自我迭代，上海AI Lab数据合成新范式

仅使用20K合成数据，就能让Qwen模型能力飙升——

来自主题: AI技术研报

6068 点击 2025-01-23 11:37

可灵视频生成可控性为什么这么好？快手又公开了四篇研究

可灵，视频生成领域的佼佼者，近来动作不断。继发布可灵 1.6 后，又公开了多项研究揭示视频生成的洞察与前沿探索 ——《快手可灵凭什么频繁刷屏？揭秘背后三项重要研究》。

来自主题: AI技术研报

7471 点击 2025-01-23 11:32

选择/杂交/突变，DeepMind将自然选择引入LLM思维，实现心智进化

今天是个好日子，DeepSeek 与 Kimi 都更新了最新版的推理模型，吸引了广泛关注。与此同时，谷歌 DeepMind、加州大学圣地亚哥分校、阿尔伯塔大学的一篇新的研究论文也吸引了不少眼球，并直接冲上了 Hugging Face 每日论文榜第一（1 月 20 日）。

来自主题: AI技术研报

6202 点击 2025-01-23 10:58

6天连发6模型，阶跃稳稳蝉联多模态卷王

我勒个老天奶，大模型六小强之一的阶跃星辰，给大家拜早年的方式可真不一样——

来自主题: AI技术研报

3893 点击 2025-01-23 10:50

智元机器人北大实习生推出OmniManip，引入自我校正机制，缓解大模型幻觉

2024年，智元机器人与北大成立联合实验室，8月发布“远征”与“灵犀”两大系列共五款商用人形机器人新品，10月旗下灵犀X1人形机器人官宣开源，12月宣布正式开启通用机器人量产，不断拓展应用场景。

来自主题: AI技术研报

5941 点击 2025-01-22 18:34

登Nature子刊，北大团队用AI预测新冠/艾滋病/流感病毒进化方向，精度提升67%

北京大学信息工程学院田永鸿教授、陈杰副教授，联合广州国家实验室周鹏研究员指导博士生聂志伟、硕士生刘旭东等，提出了一种进化驱动的病毒变异驱动力预测框架 E2VD，可以对新冠病毒、流感病毒、寨卡病毒、艾滋病病毒进行预测。

来自主题: AI技术研报

6025 点击 2025-01-22 18:18

AI智能体2小时击败人类，引爆贝叶斯推理革命！仅用10%数据训练秒杀大模型

就在刚刚，Verses团队研发的Genius智能体，在Pong中超越了人类顶尖玩家！而且它仅仅训练2小时，用了1/10数据，就秒杀了其他顶级AI模型。

来自主题: AI技术研报

6081 点击 2025-01-22 11:20

人大清华提出自主搜索版「Search-o1」！解决知识困境，大幅提升推理模型可靠性

人大清华团队提出Search-o1框架，大幅提升推理模型可靠性。尤其是「文档内推理」模块有效融合了知识学习与推理过程，在「搜索+学习」范式基础上，使得模型的推理表现与可靠性都更上一层楼。

来自主题: AI技术研报

6157 点击 2025-01-22 10:28

中科院北大等揭示「蒸馏真相」：除Claude豆包Gemini，其他很多模型都「蒸」过头

模型蒸馏也有「度」，过度蒸馏，只会导致模型性能下降。最近，来自中科院、北大等多家机构提出全新框架，从两个关键要素去评估和量化蒸馏模型的影响。结果发现，除了豆包、Claude、Gemini之外，大部分开/闭源LLM蒸馏程度过高。

来自主题: AI技术研报

4267 点击 2025-01-21 22:30

首个公开发表的SAR图像目标识别基础模型！国防科大刘永祥&刘丽教授团队提出SARATR-X 1.0

在人工智能基础模型技术飞速发展的今天，SAR 图像解译领域技术创新与发展生态亟待突破。为了解决上述技术挑战，国防科技大学电子科学学院刘永祥&刘丽教授团队提出首个公开发表的SAR图像目标识别基础模型SARATR-X 1.0。

来自主题: AI技术研报

4879 点击 2025-01-21 22:21

无直接数据可用，AI怎么学会「干活」？微软团队揭秘AI从语言到行动的进化之路

该技术报告的主要作者 Lu Wang, Fangkai Yang, Chaoyun Zhang, Shilin He, Pu Zhao, Si Qin 等均来自 Data, Knowledge, and Intelligence (DKI) 团队，为微软 TaskWeaver, WizardLLM, Windows GUI Agent UFO 的核心开发者。

来自主题: AI技术研报

5817 点击 2025-01-21 22:16

DeepSeek-R1 是怎么训练的｜深度拆解

昨天晚上，DeepSeek 又开源了 DeepSeek-R1 模型（后简称 R1），再次炸翻了中美互联网： R1 遵循 MIT License，允许用户通过蒸馏技术借助 R1 训练其他模型。 R1 上线 API，对用户开放思维链输出 R1 在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版，小模型则超越 OpenAI o1-mini

来自主题: AI技术研报

18845 点击 2025-01-21 13:15

AI模拟社会的“幕后”操控者是谁？

设想一场高度智能的模拟游戏，游戏的角色不再是普通的NPC，而是由大语言模型驱动的智能体。在这其中，悄然生出一个趣事——在人类的设计下，这些新NPC的言行不经意间变得过于啰嗦。

来自主题: AI技术研报

6382 点击 2025-01-21 10:42

理解李继刚提示词的关键绝不在于lisp语言

李继刚在消失半年后，带着汉语新解重新归来，一出手大家就惊呼李继刚的prompt已经到了next level。但不懂编程的小白又懵逼了！怎么提示词也开始编程了？大语言模型的优势不是通过说话就能达成需求吗？怎么又开始需要编程了？技术在倒退吗？

来自主题: AI技术研报

6037 点击 2025-01-21 10:25

给大模型制作图文并茂的教科书: 从2.5年的教学视频里挖掘多模态语料

近期关于 scaling law 的讨论甚嚣尘上，很多观点认为 scale law is dead. 然而，我们认为，高质量的 “无监督” 数据才是 scaling law 的关键，尤其是教科书级别的高质量的知识语料。此外，尽管传统的语料快枯竭了，但是互联网上还有海量的视频并没有被利用起来，它们囊括了丰富的多种模态的知识，可以帮助 VLMs 更好好地理解世界。

来自主题: AI技术研报

6176 点击 2025-01-20 19:01

【Claude Prompt】认知边界拓宽器：都说认知改命，认知是什么？

名称：认知边界拓宽器 Cognition Boundary Expander

来自主题: AI技术研报

6216 点击 2025-01-20 11:19

选LLM-Judge评估，用这个可证明的人类对齐评估框架， ICLR2025匿名论文

在当今AI技术迅猛发展的背景下，大语言模型（LLM）的评估问题已成为一个不可忽视的挑战。传统的做法是直接采用最强大的模型（如GPT-4）进行评估，这就像让最高法院的大法官直接处理所有交通违章案件一样，既不经济也不一定总能保证公正。

来自主题: AI技术研报

5216 点击 2025-01-20 10:50

AI编程蓝皮书：0基础4小时学会开发

大家好，我是AI产品黄叔，目前给两家大厂做AI产品顾问，在使用Cursor和Windsurf（这两个都是AI编程的软件）开发产品后，意识到这才是创造者的天堂，最近举办了三场线下AI编程培训，根据学员的反馈有了这份手册，我会在本手册里持续更新，不断把更多的技巧，思考分享出来，希望能够帮助想要创造的你走进这个天堂！如果你觉得有帮助，欢迎把文末的图片分享给你的朋友：

来自主题: AI技术研报

10984 点击 2025-01-20 09:14

细粒度对齐无需仔细标注了！淘天提出视觉锚定奖励，自我校准实现多模态对齐

近年来，视觉大模型（Large Vision Language Models, LVLMs）领域经历了迅猛的发展，这些模型在图像理解、视觉对话以及其他跨模态任务中展现出了卓越的能力。然而，随着 LVLMs 复杂性和能力的增长，「幻觉现象」的挑战也日益凸显。

来自主题: AI技术研报

5858 点击 2025-01-19 14:51

宇树机器人上演弯道超车(ren)，歪果仁质疑是特效

什么，歪果仁怀疑咱中国的宇树机器人昨天释放的最新视频，是特效？

来自主题: AI技术研报

9010 点击 2025-01-18 15:57

Search版o1：推理过程会主动查资料，整体性能优于人类专家，清华人大出品

一个新框架，让Qwen版o1成绩暴涨：在博士级别的科学问答、数学、代码能力的11项评测中，能力显著提升，拿下10个第一！这就是人大、清华联手推出的最新「Agentic搜索增强推理模型框架」Search-o1的特别之处。

来自主题: AI技术研报

6211 点击 2025-01-18 15:00