AI技术研报-这里有最前沿的人工智能技术解读

ACL 2025主会论文 | TRIDENT：基于三维多样化红队数据合成的LLM安全增强方法

大语言模型（LLM）已经在多项自然语言处理任务中展现出卓越能力，但其潜在安全风险仍然是阻碍规模化落地的关键瓶颈。目前社区用于安全对齐的公开数据集，往往偏重于「词汇多样性」，即让同一种风险指令尽可能用不同的表达方式出现，却很少系统考虑指令背后的「恶意意图多样性」以及「越狱策略多样性」。

来自主题: AI技术研报

7303 点击 2025-08-01 10:37

OpenAI提出的CLIP，被Meta联合谢赛宁、刘壮，扩展到全球300+语言

在人工智能领域，对比语言 - 图像预训练（CLIP）是一种流行的基础模型，由 OpenAI 提出

来自主题: AI技术研报

8077 点击 2025-07-31 15:56

DeepSeek下一代技术提前曝光，梁文锋署名论文获ACL2025最佳论文奖

在ACL 2025的颁奖典礼上，由DeepSeek梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。这次ACL 2025规模空前，总投稿量达到8360篇，相较于去年的4407篇几乎翻倍，竞争异常激烈。

来自主题: AI技术研报

7216 点击 2025-07-31 11:48

偶然间发现了一个很逆天的东西—SeedVR2

你有没有想要修复的老照片或者视频？

来自主题: AI技术研报

6858 点击 2025-07-31 11:13

第三代神经网络模型：面向AI应用的脉冲神经网络

1997年，Wolfgang Maass于Networks of spiking neurons: The third generation of neural network models一文中提出，由脉冲神经元构成的网络——脉冲神经网络（SNN），能够展现出更强大的计算特性，会成为继人工神经网络后的“第三代神经网络模型”[6]。

来自主题: AI技术研报

7746 点击 2025-07-31 10:41

6000 字，学不会退网！藏师傅Trickle AI保姆级Vibe Coding高级通关攻略

大家好，我是歸藏（guizang），给大家带来肝了两天的用 Trickle AI 进行一些高级 Vibe Coding 的保姆级教程。

来自主题: AI技术研报

9478 点击 2025-07-31 10:39

SPIRAL：零和游戏自对弈成为语言模型推理训练的「免费午餐」

近年来，OpenAI o1 和 DeepSeek-R1 等模型的成功证明了强化学习能够显著提升语言模型的推理能力。通过基于结果的奖励机制，强化学习使模型能够发展出可泛化的推理策略，在复杂问题上取得了监督微调难以企及的进展。

来自主题: AI技术研报

5883 点击 2025-07-31 10:10

当智能成为主要生产资料，硅基经济学引爆「AI+金融」

从碳基迈向硅基，华东师范大学上海人工智能金融学院院长邵怡蕾提出「硅基经济学」

来自主题: AI技术研报

8617 点击 2025-07-30 15:13

我在WAIC看见的十大趋势

太热了，实在太热了。你能想象吗？一个AI行业展会，现在都有了一种明星演唱会的错觉。

来自主题: AI技术研报

8963 点击 2025-07-30 14:54

超越DeepSeek-R1，数学形式化准确率飙升至84% | 字节&南大开源

当人工智能已经能下围棋、写代码，如何让机器理解并证明数学定理，仍是横亘在科研界的重大难题。

来自主题: AI技术研报

9919 点击 2025-07-30 11:01

自回归模型杀回图像生成！实现像素级精准控制，比Diffusion更高效可控

当下的AI图像生成领域，Diffusion模型无疑是绝对的王者，但在精准控制上却常常“心有余而力不足”。

来自主题: AI技术研报

9668 点击 2025-07-30 10:55

AI时代，作者已死？

对于任何书面文件，比如此刻你正阅读的这篇文章，追问它出自谁手，似乎理所当然。为此，你可能会八卦一番作者履历，了解作者的一些背景，因作者身份能助你辨认他所写内容的权威性。譬如，对于此文，如果我的履历显示我任职于美国的一所大学的传播学教授，你可能会据此认定我谈论大语言模型相关的颠覆性事件是恰如其分的，甚至因此信任我的观点。毕竟，你已确认了“作者”的身份并发现他在此领域颇有建树。

来自主题: AI技术研报

7094 点击 2025-07-30 10:45

LeCun出手，造出视频世界模型，挑战英伟达COSMOS

2018 年，LSTM 之父 Jürgen Schmidhuber 在论文中（ Recurrent world models facilitate policy evolution ）推广了世界模型（world model）的概念，这是一种神经网络，它能够根据智能体过去的观察与动作，预测环境的未来状态。

来自主题: AI技术研报

6962 点击 2025-07-30 10:23

开启RL Scaling新纪元，siiRL开源：完全分布式强化学习框架，支持超千卡规模高效训练

还在为强化学习（RL）框架的扩展性瓶颈和效率低下而烦恼吗？

来自主题: AI技术研报

8359 点击 2025-07-30 10:15

全球首次，「AI记忆」开源落地！MIRIX同步上线APP

加利福尼亚大学圣迭戈分校博士生王禹和纽约大学教授陈溪联合推出并开源了 MIRIX，全球首个真正意义上的多模态、多智能体AI记忆系统。MIRIX团队同步上线了一款桌面端APP，可直接下载使用！

来自主题: AI技术研报

9857 点击 2025-07-29 16:22

ICML25|标点符号竟是LLM记忆核心！正确处理性能暴涨

近年来，大语言模型（LLM）的能力越来越强，但它们的“饭量”也越来越大。这个“饭量”主要体现在计算和内存上。当模型处理的文本越来越长时，一个叫做“自注意力（Self-Attention）”的核心机制会导致计算量呈平方级增长。这就像一个房间里的人开会，如果每个人都要和在场的其他所有人单独聊一遍，那么随着人数增加，总的对话次数会爆炸式增长。

来自主题: AI技术研报

6824 点击 2025-07-29 12:29

EvaLearn：AI下半场的全新评测范式！

在三个月前，OpenAI 研究员 Shunyu Yao 发表了一篇关于 AI 的下半场的博客引起了广泛讨论。他在博客中指出，AI 研究正在从 “能不能做” 转向 “学得是否有效”，传统的基准测试已经难以衡量 AI 的实际效用，他指出现有的评估方式中，模型被要求独立完成每个任务，然后取平均得分。这种方式忽略了任务之间的连贯性，无法评估模型长期适应能力和更类人的动态学习能力。

来自主题: AI技术研报

7271 点击 2025-07-29 10:54