AI技术研报-这里有最前沿的人工智能技术解读

Coze Skill 速通教程：一文学会 Skill 设计方法

你可以卖自己的 Skills 了。

来自主题: AI技术研报

11264 点击 2026-01-20 10:58

机器人终于「懂」家务了！伯克利MomaGraph让机器人像人一样做家务

想象这样一个日常画面：你吩咐家用机器人「烧壶开水」，它却当场卡壳——水壶在哪？该接自来水还是过滤水？先插电还是先按开关？水开了又该如何判断？这些对人类而言像呼吸一样自然的家务，对过去的机器人却是大大的难题：要么忘了插电，要么找不到水壶，甚至会把柜门把手错当成开关一通乱按。

来自主题: AI技术研报

9091 点击 2026-01-20 10:57

定位大模型「作弊」神经回路！新研究首次揭示：虚假奖励如何精准激活第18-20层记忆

无需真实奖励，哪怕用随机、错误的信号进行训练，大模型准确率也能大幅提升？

来自主题: AI技术研报

10094 点击 2026-01-20 10:16

真·开外挂！MIT新研究：架构0改动，让大模型解锁千万级上下文

让大模型轻松处理比自身上下文窗口长两个数量级的超长文本！

来自主题: AI技术研报

6691 点击 2026-01-19 16:47

你的论文有novelty吗？复旦搞了个顶会论文查新系统

ICLR 2026 的 Rebuttal 结束了。当 OpenReview 上的喧嚣散去，我们发现，作者与审稿人之间漫长的拉锯战，最终往往只剩下一个核心分歧：「这个想法，以前真的没人做过吗？」

来自主题: AI技术研报

9500 点击 2026-01-19 16:45

效果、性能双突破，快手OneSug端到端生成式框架入选AAAI 2026

当你在电商平台搜索“苹果”，系统会推荐“水果”还是“手机”？或者直接跳到某个品牌旗舰店？短短一个词，背后承载了完全不同的购买意图。而推荐是否精准，直接影响用户的搜索体验，也影响平台的转化效率。

来自主题: AI技术研报

11275 点击 2026-01-19 15:15

零样本&少样本横扫12个工业医疗数据集：西门子×腾讯优图新研究精准定位缺陷，检测精度新SOTA丨AAAI 2026

视觉模型用于工业“缺陷检测”等领域已经相对成熟，但当前普遍使用的传统模型在训练时对数据要求较高，需要大量的经过精细标注的数据才能训练出理想效果。

来自主题: AI技术研报

9365 点击 2026-01-19 15:13

让机器人看视频学操作技能，清华等全新发布的CLAP框架做到了

近日，清华大学与星尘智能、港大、MIT 联合提出基于对比学习的隐空间动作预训练（Contrastive Latent Action Pretraining, CLAP）框架。这个框架能够将视频中提纯的运动空间与机器人的动作空间进行对齐，也就是说，机器人能够直接从视频中学习技能！

来自主题: AI技术研报

8465 点击 2026-01-19 15:13

打造中国的Skild AI，复旦教授要让每个机器人拥有可自主进化的通用大脑

2025年，风光无限的机器人们在Demo中大秀绝活，从叠衣服、工厂和物流站分拣包裹，到零售店卖货……它们忙碌的身影存在于各种各样的场景中。但回到现实世界，具身智能真正参与的生活和生产环节，却少之又少。

来自主题: AI技术研报

8818 点击 2026-01-19 09:37

Obsidian + AI，笔记效率提升10倍！一键生成Canvas和小红书风格笔

在日常工作和学习中，笔记管理一直是个让人头疼的问题。传统的笔记工具要么功能单一，要么需要手动绘制各种图表和整理格式。特别是当我们需要制作知识结构图、思维导图或者将内容转化为不同风格的笔记时，往往需要花费大量时间和精力。

来自主题: AI技术研报

10015 点击 2026-01-19 09:35

用2D先验自动生成3D标注，自动驾驶、具身智能有福了丨IDEA团队开源

3D模型的实例分割一直受限于稀缺的训练数据与高昂的标注成本，训练效果有待提升。

来自主题: AI技术研报

10417 点击 2026-01-19 08:55

VerseCrafter：给视频世界模型装上4D方向盘，精准运镜控物

视频世界模型领域又迎来了新的突破！

来自主题: AI技术研报

9373 点击 2026-01-19 08:55

任意条件，「可控」文生图扩散模型综述 | TPAMI'25

北邮最新综述探讨了文生图扩散模型的可控生成技术，总结了在文本条件之外引入新条件信号的方法，从任务和方法两个层面梳理了可控生成技术。

来自主题: AI技术研报

9489 点击 2026-01-19 08:55

腾讯AngelSlim升级，首个集LLM、VLM及语音多模态为一体的投机采样训练框架，推理速度飙升1.8倍

随着大模型步入规模化应用深水区，日益高昂的推理成本与延迟已成为掣肘产业落地的核心瓶颈。在 “降本增效” 的行业共识下，从量化、剪枝到模型蒸馏，各类压缩技术竞相涌现，但往往难以兼顾性能损耗与通用性。

来自主题: AI技术研报

11097 点击 2026-01-19 08:54

机器人终于能用明白洗碗机了｜UC伯克利新研究

在家庭厨房自主使用洗碗机，在办公室边移动边擦拭白板——这些人类习以为常的场景，对人形机器人来说，却是需要调动全身关节协同运作才能完成的“高难度挑战”。

来自主题: AI技术研报

11068 点击 2026-01-19 08:53

开源8300小时标注数据，新一代实时通用游戏AI Pixel2Play发布

来自 Player2 的研究员们提出了 Pixel2Play（P2P）模型，该模型以游戏画面和文本指令作为输入，直接输出对应的键盘与鼠标操作信号。在消费级显卡 RTX 5090 上，P2P 可以实现超过 20Hz 的端到端推理速度，从而能够真正像人类一样和游戏进行实时交互。P2P 作为通用游戏基座模型，在超过 40 款游戏、总计 8300 + 小时的游戏数据上进行了训练，

来自主题: AI技术研报

8973 点击 2026-01-18 15:01

Gemini准确率从21%飙到97%！谷歌只用了这一招：复制粘贴

简单到难以置信！近日，Google Research一项新研究发现：想让大模型在不启用推理设置时更准确，只需要把问题复制粘贴再说一遍，就能把准确率从21.33%提升到97.33%！

来自主题: AI技术研报

10411 点击 2026-01-18 14:58

狂飙、混战与定局：全球 AI 应用生态三年的结构性洗牌（2023-2025）

如果将2023年定义为AI的“奇点大爆炸”，那么站在2025年的终章回望，我们不得不承认：“百模大战”的硝烟已散，一个残酷而清晰的“双极化”新世界已然定型。2023-2025 这三年，全球 AI 应用市场完成了从“单点工具猎奇”向“双极化生态定局”的结构性跨越。

来自主题: AI技术研报

9212 点击 2026-01-18 14:58

解锁任意步数文生图，港大&Adobe全新Self-E框架学会自我评估

香港大学（The University of Hong Kong）与 Adobe Research 联合发布 Self-E（Self-Evaluating Model）：一种无需预训练教师蒸馏、从零开始训练的任意步数文生图框架。其目标非常直接：让同一个模型在极少步数也能生成语义清晰、结构稳定的图像，同时在 50 步等常规设置下保持顶级质量，并且随着步数增加呈现单调提升。

来自主题: AI技术研报

9627 点击 2026-01-18 14:57