AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型

思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型

思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型

近期,随着OpenAI-o1/o3和Deepseek-R1的成功,基于强化学习的微调方法(R1-Style)在AI领域引起广泛关注。这些方法在数学推理和代码智能方面展现出色表现,但在通用多模态数据上的应用研究仍有待深入。

来自主题: AI技术研报
6545 点击    2025-08-01 16:08
又一SOTA级开源模型!阶跃Step-3多模态推理登顶,百万token解码成本不到4毛钱

又一SOTA级开源模型!阶跃Step-3多模态推理登顶,百万token解码成本不到4毛钱

又一SOTA级开源模型!阶跃Step-3多模态推理登顶,百万token解码成本不到4毛钱

又一个SOTA基础模型开源,而且依然是国产。 刚刚,阶跃星辰兑现了WAIC上的承诺,将最新多模态推理模型Step-3正式开源! 在MMMU等多个多模态榜单上,它一现身就取得了开源多模态推理模型新SOTA的成绩。

来自主题: AI技术研报
6012 点击    2025-08-01 12:52
ACL'25最佳论文独家解读:大模型有「抗改造」基因,现有后训练范式失灵预警

ACL'25最佳论文独家解读:大模型有「抗改造」基因,现有后训练范式失灵预警

ACL'25最佳论文独家解读:大模型有「抗改造」基因,现有后训练范式失灵预警

尽管全球科技界正热烈庆祝 GPT-4、DeepSeek 等大模型展现出的惊艳能力,但一个根本性问题仍未被真正解决: 这些 AI 模型是否真正理解人类的指令与意图?

来自主题: AI技术研报
5939 点击    2025-08-01 12:27
当提示词优化器学会进化,竟能胜过强化学习

当提示词优化器学会进化,竟能胜过强化学习

当提示词优化器学会进化,竟能胜过强化学习

仅靠提示词优化就能超越 DeepSeek 开发的 GRPO 强化学习算法? 是的,你没有看错。近日上线 arXiv 的一篇论文正是凭此吸引了无数眼球。

来自主题: AI技术研报
5941 点击    2025-08-01 11:42
VLA-OS:NUS邵林团队探究机器人VLA做任务推理的秘密

VLA-OS:NUS邵林团队探究机器人VLA做任务推理的秘密

VLA-OS:NUS邵林团队探究机器人VLA做任务推理的秘密

为什么机器人能听懂指令却做不对动作?语言大模型指挥机器人,真的是最优解吗?端到端的范式到底是不是通向 AGI 的唯一道路?这些问题背后,藏着机器智能的未来密码。

来自主题: AI技术研报
6018 点击    2025-08-01 11:18
随手拍照片就能VR云旅游!无位姿、稀疏图像条件下实现稳定3D重建和新视角合成|港科广

随手拍照片就能VR云旅游!无位姿、稀疏图像条件下实现稳定3D重建和新视角合成|港科广

随手拍照片就能VR云旅游!无位姿、稀疏图像条件下实现稳定3D重建和新视角合成|港科广

想象一下,你随便用手机拍了几张家里的照片,没有精确的相机位置,甚至照片之间重叠都很少。 现在,一个新算法能把这些零散的2D图片,“拼”成一个厘米级精度的3D数字模型,效果好到可以直接放进VR头显里“云旅游”。

来自主题: AI技术研报
5604 点击    2025-08-01 10:53
ACL 2025主会论文 | TRIDENT:基于三维多样化红队数据合成的LLM安全增强方法

ACL 2025主会论文 | TRIDENT:基于三维多样化红队数据合成的LLM安全增强方法

ACL 2025主会论文 | TRIDENT:基于三维多样化红队数据合成的LLM安全增强方法

大语言模型(LLM)已经在多项自然语言处理任务中展现出卓越能力,但其潜在安全风险仍然是阻碍规模化落地的关键瓶颈。目前社区用于安全对齐的公开数据集,往往偏重于「词汇多样性」,即让同一种风险指令尽可能用不同的表达方式出现,却很少系统考虑指令背后的「恶意意图多样性」以及「越狱策略多样性」。

来自主题: AI技术研报
6052 点击    2025-08-01 10:37
DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖

DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖

DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖

在ACL 2025的颁奖典礼上,由DeepSeek梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次ACL 2025规模空前,总投稿量达到8360篇,相较于去年的4407篇几乎翻倍,竞争异常激烈 。

来自主题: AI技术研报
6016 点击    2025-07-31 11:48
偶然间发现了一个很逆天的东西—SeedVR2

偶然间发现了一个很逆天的东西—SeedVR2

偶然间发现了一个很逆天的东西—SeedVR2

你有没有想要修复的老照片或者视频?

来自主题: AI技术研报
5051 点击    2025-07-31 11:13
第三代神经网络模型:面向AI应用的脉冲神经网络

第三代神经网络模型:面向AI应用的脉冲神经网络

第三代神经网络模型:面向AI应用的脉冲神经网络

1997年,Wolfgang Maass于Networks of spiking neurons: The third generation of neural network models一文中提出,由脉冲神经元构成的网络——脉冲神经网络(SNN),能够展现出更强大的计算特性,会成为继人工神经网络后的“第三代神经网络模型”[6]。

来自主题: AI技术研报
6562 点击    2025-07-31 10:41
SPIRAL:零和游戏自对弈成为语言模型推理训练的「免费午餐」

SPIRAL:零和游戏自对弈成为语言模型推理训练的「免费午餐」

SPIRAL:零和游戏自对弈成为语言模型推理训练的「免费午餐」

近年来,OpenAI o1 和 DeepSeek-R1 等模型的成功证明了强化学习能够显著提升语言模型的推理能力。通过基于结果的奖励机制,强化学习使模型能够发展出可泛化的推理策略,在复杂问题上取得了监督微调难以企及的进展。

来自主题: AI技术研报
4381 点击    2025-07-31 10:10
当智能成为主要生产资料,硅基经济学引爆「AI+金融」

当智能成为主要生产资料,硅基经济学引爆「AI+金融」

当智能成为主要生产资料,硅基经济学引爆「AI+金融」

从碳基迈向硅基,华东师范大学上海人工智能金融学院院长邵怡蕾提出「硅基经济学」

来自主题: AI技术研报
7405 点击    2025-07-30 15:13
我在WAIC看见的十大趋势

我在WAIC看见的十大趋势

我在WAIC看见的十大趋势

太热了,实在太热了。 你能想象吗?一个AI行业展会,现在都有了一种明星演唱会的错觉。

来自主题: AI技术研报
7622 点击    2025-07-30 14:54
超越DeepSeek-R1,数学形式化准确率飙升至84% | 字节&南大开源

超越DeepSeek-R1,数学形式化准确率飙升至84% | 字节&南大开源

超越DeepSeek-R1,数学形式化准确率飙升至84% | 字节&南大开源

当人工智能已经能下围棋、写代码,如何让机器理解并证明数学定理,仍是横亘在科研界的重大难题。

来自主题: AI技术研报
8798 点击    2025-07-30 11:01
AI时代,作者已死?

AI时代,作者已死?

AI时代,作者已死?

对于任何书面文件,比如此刻你正阅读的这篇文章,追问它出自谁手,似乎理所当然。为此,你可能会八卦一番作者履历,了解作者的一些背景,因作者身份能助你辨认他所写内容的权威性。譬如,对于此文,如果我的履历显示我任职于美国的一所大学的传播学教授,你可能会据此认定我谈论大语言模型相关的颠覆性事件是恰如其分的,甚至因此信任我的观点。毕竟,你已确认了“作者”的身份并发现他在此领域颇有建树。

来自主题: AI技术研报
5965 点击    2025-07-30 10:45
LeCun出手,造出视频世界模型,挑战英伟达COSMOS

LeCun出手,造出视频世界模型,挑战英伟达COSMOS

LeCun出手,造出视频世界模型,挑战英伟达COSMOS

2018 年,LSTM 之父 Jürgen Schmidhuber 在论文中( Recurrent world models facilitate policy evolution )推广了世界模型(world model)的概念,这是一种神经网络,它能够根据智能体过去的观察与动作,预测环境的未来状态。

来自主题: AI技术研报
5642 点击    2025-07-30 10:23
全球首次,「AI记忆」开源落地!MIRIX同步上线APP

全球首次,「AI记忆」开源落地!MIRIX同步上线APP

全球首次,「AI记忆」开源落地!MIRIX同步上线APP

加利福尼亚大学圣迭戈分校博士生王禹和纽约大学教授陈溪联合推出并开源了 MIRIX,全球首个真正意义上的多模态、多智能体AI记忆系统。MIRIX团队同步上线了一款桌面端APP,可直接下载使用!

来自主题: AI技术研报
8307 点击    2025-07-29 16:22
ICML25|标点符号竟是LLM记忆核心!正确处理性能暴涨

ICML25|标点符号竟是LLM记忆核心!正确处理性能暴涨

ICML25|标点符号竟是LLM记忆核心!正确处理性能暴涨

近年来,大语言模型(LLM)的能力越来越强,但它们的“饭量”也越来越大。这个“饭量”主要体现在计算和内存上。当模型处理的文本越来越长时,一个叫做“自注意力(Self-Attention)”的核心机制会导致计算量呈平方级增长。这就像一个房间里的人开会,如果每个人都要和在场的其他所有人单独聊一遍,那么随着人数增加,总的对话次数会爆炸式增长。

来自主题: AI技术研报
5446 点击    2025-07-29 12:29
EvaLearn:AI下半场的全新评测范式!

EvaLearn:AI下半场的全新评测范式!

EvaLearn:AI下半场的全新评测范式!

在三个月前,OpenAI 研究员 Shunyu Yao 发表了一篇关于 AI 的下半场的博客引起了广泛讨论。他在博客中指出,AI 研究正在从 “能不能做” 转向 “学得是否有效”,传统的基准测试已经难以衡量 AI 的实际效用,他指出现有的评估方式中,模型被要求独立完成每个任务,然后取平均得分。这种方式忽略了任务之间的连贯性,无法评估模型长期适应能力和更类人的动态学习能力。

来自主题: AI技术研报
6447 点击    2025-07-29 10:54
抗干扰能力提升近40% !无需对抗训练,北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

抗干扰能力提升近40% !无需对抗训练,北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

抗干扰能力提升近40% !无需对抗训练,北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

在人工智能模型规模持续扩大的今天,数据集蒸馏(Dataset Distillation,DD)方法能够通过使用更少的数据,达到接近完整数据的训练效果,提升模型训练效率,降低训练成本。

来自主题: AI技术研报
5597 点击    2025-07-29 10:12
超越RAG的搜索革命!分层框架让AI像专家团队一样深度思考

超越RAG的搜索革命!分层框架让AI像专家团队一样深度思考

超越RAG的搜索革命!分层框架让AI像专家团队一样深度思考

一句话概括:与其训练一个越来越大的“六边形战士”AI,不如组建一个各有所长的“复仇者联盟”,这篇论文就是那本“联盟组建手册”。

来自主题: AI技术研报
8434 点击    2025-07-29 10:09
拆箱开源版Coze:Agent核心三件套大公开,48小时揽下9K Star

拆箱开源版Coze:Agent核心三件套大公开,48小时揽下9K Star

拆箱开源版Coze:Agent核心三件套大公开,48小时揽下9K Star

搞Agent开发也有开源一条龙了!这不,扣子的两款子产品已于近期正式开源:扣子开发平台(Coze Studio)和扣子罗盘(Coze Loop)。才过了一个周末,两个项目就拿下了9K Star~

来自主题: AI技术研报
6136 点击    2025-07-28 17:43
Nature子刊 | 上交突破极限,端到端无人机高速避障,可微分物理实现

Nature子刊 | 上交突破极限,端到端无人机高速避障,可微分物理实现

Nature子刊 | 上交突破极限,端到端无人机高速避障,可微分物理实现

上海交通大学研究团队提出了一种融合无人机物理建模与深度学习的端到端方法,实现了轻量、可部署、可协同的无人机集群自主导航方案,其鲁棒性和机动性大幅领先现有方案。

来自主题: AI技术研报
7038 点击    2025-07-28 11:26