AI技术研报-这里有最前沿的人工智能技术解读

时隔6年BERT升级！仅编码器架构没被杀死，更快更准确更长上下文

时隔6年，一度被认为濒死的“BERT”杀回来了——

来自主题: AI技术研报

6589 点击 2024-12-25 10:21

ControlNet作者张吕敏再出新项目LuminaBrush！

刚刚，ControlNet作者张吕敏又发布了一个的图像打光新项目LuminaBrush，LuminaBrush 是一个构建交互式工具的项目，用于在图像上绘制光照效果。该框架采用两阶段方法：首先将图像转换为均匀光照的外观；然后通过用户的涂鸦生成光照效果。

来自主题: AI技术研报

6235 点击 2024-12-25 09:15

微软开源PromptWizard，摔碎了提示工程师的饭碗~

PromptWizard (PW) 旨在自动化和简化提示优化。它将 LLM 的迭代反馈与高效的探索和改进技术相结合，在几分钟内创建高效的prompts。

来自主题: AI技术研报

10826 点击 2024-12-25 09:09

AI视频生成平台全球前3，成本暴降50%方案开源！500元GPU算力免费薅

随着Sora震撼发布，视频生成技术成为了AI领域新风口。不过，高昂的开发成本是一大瓶颈。国产平台Video Ocean不仅成功登上全球热榜第三，还将视频生成模型开发成本降低50%。而且，模型构建和性能优化方案现已开源，还能免费获得500元GPU算力。

来自主题: AI技术研报

5780 点击 2024-12-24 17:09

Anthropic预测：2025是智能体系统年！年终总结分享最佳实践

近日，Anthropic开发者关系主管发推表示：万事俱备，2025年将是智能体系统之年！在年终总结的博文中，Anthropic分享了一年来与客户合作构建智能体系统的最佳实践。

来自主题: AI技术研报

7261 点击 2024-12-24 16:59

Meta、斯坦福等：AI的下一个前沿，正是陶哲轩说的形式化数学推理

对 AI 研究者来说，数学既是一类难题，也是一个标杆，能够成为衡量 AI 技术的发展重要尺度。近段时间，随着 AI 推理能力的提升，使用 AI 来证明数学问题已经成为一个重要的研究探索方向。

来自主题: AI技术研报

8245 点击 2024-12-24 15:37

行人、车辆、动物等ReID最新综述！武大等全面总结Transformer方法 | IJCV 2024

研究人员对基于Transformer的Re-ID研究进行了全面回顾和深入分析，将现有工作分类为图像/视频Re-ID、数据/标注受限的Re-ID、跨模态Re-ID以及特殊Re-ID场景，提出了Transformer基线UntransReID，设计动物Re-ID的标准化基准测试，为未来Re-ID研究提供新手册。

来自主题: AI技术研报

6344 点击 2024-12-24 15:22

清华姚班博士APPL实战，用Cursor复现北航、字节的Prompt优化框架ERM，准确率提高到99.3%

上周发出《AI时代写Prompt应该用APPL：为Prompt工程打造的编程语言，来自清华姚班的博士》之后，文章中实现了一个Google DeepMind的OPRO简单版本的优化方法，这让很多读者非常着迷。

来自主题: AI技术研报

8558 点击 2024-12-24 15:13

清华、智谱团队：探索 RLHF 的 scaling laws

目前关于 RLHF 的 scaling（扩展）潜力研究仍然相对缺乏，尤其是在模型大小、数据组成和推理预算等关键因素上的影响尚未被系统性探索。针对这一问题，来自清华大学与智谱的研究团队对 RLHF 在 LLM 中的 scaling 性能进行了全面研究，并提出了优化策略。

来自主题: AI技术研报

10804 点击 2024-12-24 14:56

如何理解 OpenAI o3 ？以及对其的技术分析

目前o3放出的信息还不多，但还是有一些内容可以做技术分析的。以及o3的重要性值得做一个专篇讨论。

来自主题: AI技术研报

9597 点击 2024-12-24 11:05

压缩思维链CCoT：一种突破性的高效AI推理新范式

在大语言模型（LLM）的发展历程中，思维链（Chain of Thought，CoT）推理无疑是一个重要的里程碑。

来自主题: AI技术研报

10063 点击 2024-12-24 09:51

腾讯利用AI完美破译「黑白世界」，实现动画色彩“无损还原”，国产动漫产业{光速逆袭}！

扩散模型在可控图像生成方面取得了空前进展，包括图像修补，图像着色和图像编辑。基于扩散模型的生成方案可以显著降低劳动力成本，尤其是在基于参考图像序列着色任务上，它可用于漫画创作，动画制作和黑白电影着色。

来自主题: AI技术研报

8852 点击 2024-12-23 17:22

李飞飞谢赛宁：多模态LLM「空间大脑」觉醒，惊现世界模型雏形！

李飞飞、谢赛宁团队又有重磅发现了：多模态LLM能够记住和回忆空间，甚至内部已经形成了局部世界模型，表现了空间意识！李飞飞兴奋表示，在2025年，空间智能的界限很可能会再次突破。

来自主题: AI技术研报

9727 点击 2024-12-23 16:22

AI看病竟比医生强？哈佛、斯坦福等联合评估o1-preview，诊断准确率高达近80%

o1-preview在医疗诊断中远超人类，赛博看病指日可待？

来自主题: AI技术研报

9216 点击 2024-12-23 15:52

时序预测再出新范式！华东师大提出DUET：「双向聚类」新设计，性能刷新SOTA！| KDD 2025

研究团队在最新时间序列预测基准评测TFB的25个数据集上进行了广泛验证，证明了DUET的卓越性能，为各行业的时间序列预测任务提供了全新的解决方案。

来自主题: AI技术研报

7445 点击 2024-12-23 15:44

某机构：JSON 输出会让 AI 变笨！大佬：是你们太菜了

近期，知名研究机构 Appier AI Research 和国立台湾大学，联合发表了一篇论文

来自主题: AI技术研报

7805 点击 2024-12-23 15:31

图学习新突破：一个统一框架连接空域和频域

图数据学习在过去几年中取得了显著的进展，图神经网络（GNN）在此过程中起到了核心作用。然而，不同的 GNN 方法在概念和实现上的差异，对理解和应用图学习算法构成了挑战。

来自主题: AI技术研报

9410 点击 2024-12-23 15:21

AAAI 2025｜时间序列演进也是种扩散过程？基于移动自回归的时序扩散预测模型

在时间序列预测领域，当前主流的扩散方法还是传统的基于噪声的方法，未能充分利用自回归技术实现时间序列建模。

来自主题: AI技术研报

8384 点击 2024-12-23 15:17

李飞飞、谢赛宁等探索MLLM「视觉空间智能」，网友：2025有盼头了

我们生活在一个感官丰富的 3D 世界中，视觉信号围绕着我们，让我们能够感知、理解和与之互动。

来自主题: AI技术研报

8390 点击 2024-12-23 15:10

o3并非独门秘技，谷歌已发背后关键机制，方法更简单、成本更低

o1/o3带火的推理计算Scaling，原来谷歌早在今年8月就曾探讨过。

来自主题: AI技术研报

6098 点击 2024-12-23 14:10

百川新模型超GPT-4o近20%，首创自约束训练方案突破瓶颈，主打「领域增强」

大模型的竞速赛，正站在通用底座的基础上，掀起“领域增强”风暴。

来自主题: AI技术研报

11682 点击 2024-12-23 13:46

AAAI 2025 | 开放世界的深伪检测，北交大团队：解决好无配对数据挑战很重要

现有的深伪检测方法大多依赖于配对数据，即一张压缩图像和其对应的原始图像来训练模型，这在许多实际的开放环境中并不适用。尤其是在社交媒体等开放网络环境（OSN）中，图像通常经过多种压缩处理，导致图像质量受到影响，深伪识别也因此变得异常困难。

来自主题: AI技术研报

9599 点击 2024-12-23 09:44

自缘身在最高层？OpenAI o1 pro竞赛级评测结果新鲜出炉

近期，OpenAI 号称最强推理模型的推出，引发了社区的热议，无论是性能还是价格，都产生了不少话题。最近，我们对 o1 新发布的 o1 满血版、o1 pro mode 模型进行了高难度数学测试，旨在深入探究其在数学推理方面的能力表现。

来自主题: AI技术研报

8791 点击 2024-12-23 09:31

微软Phi-4封神，14B小模型数学击败GPT-4o！合成数据占比40%，36页技术报告出炉

微软下一代14B小模型Phi-4出世了！仅用了40%合成数据，在数学性能上击败了GPT-4o，最新36页技术报告出炉。

来自主题: AI技术研报

9154 点击 2024-12-22 15:59

诺奖得主David Baker：AI for Science的13片蓝海（上篇） - 癌症/自免治疗、阿兹海默症、分子嗅觉等

最近AI业界的观点开始产生变化，Jason Wei明确指出AI for Science蕴藏着巨大的机遇，而其中最大的场景在于AlphaFold 2掀起的蛋白质革命。

来自主题: AI技术研报

9446 点击 2024-12-21 11:45

抽卡效率提升4.8倍！东北大学等开源优化版Stable-Diffusion.cpp：分辨率越高越快，生成质量更好

北京大学等研究团队优化了Sdcpp框架，通过引入Winograd算法和多项策略，显著提升了图像生成速度和内存效率，最高可提速4.79倍。

来自主题: AI技术研报

8923 点击 2024-12-21 11:34

OpenAI o1是真有实力！港大权威AB测试，国家队奥数题照样拿下

OpenAI o1的数学推理能力是否真的那么强？近日，来自港大的研究人员对模型进行了严格的AB测试，在非公开的国家队奥数题面前，o1证明了自己的实力。

来自主题: AI技术研报

7381 点击 2024-12-21 11:30

重塑跨智能体灵巧手抓取，NUS邵林团队提出全新交互式表征，斩获CoRL Workshop最佳机器人论文奖

近期，新加坡国立大学计算机学院的邵林团队提出了 D(R,O) Grasp：一种面向跨智能体灵巧抓取的机器人与物体交互统一表示。该方法通过创新性地建模机器人手与物体在抓取姿态下的交互关系，成功实现了对多种机器人手型与物体几何形状的高度泛化能力，为灵巧抓取技术的未来开辟了全新的方向。

来自主题: AI技术研报

9933 点击 2024-12-21 11:21

人会逆向思维，LLM也可以？DeepMind研究表明还能提升推理能力

人能逆向思维，LLM 也可以吗？北卡罗来纳大学教堂山分校与谷歌最近的一项研究表明，LLM 确实可以，并且逆向思维还能帮助提升 LLM 的正向推理能力！

来自主题: AI技术研报

7088 点击 2024-12-21 11:17

统一视觉理解与生成，MetaMorph模型问世，LeCun、谢赛宁、刘壮等参与

如今，多模态大模型（MLLM）已经在视觉理解领域取得了长足进步，其中视觉指令调整方法已被广泛应用。该方法是具有数据和计算效率方面的优势，其有效性表明大语言模型（LLM）拥有了大量固有的视觉知识，使得它们能够在指令调整过程中有效地学习和发展视觉理解。

来自主题: AI技术研报

9039 点击 2024-12-21 11:12