AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
AI无师自通,搞定所有家务!π0.5突破泛化极限,UC伯克利系出品

AI无师自通,搞定所有家务!π0.5突破泛化极限,UC伯克利系出品

AI无师自通,搞定所有家务!π0.5突破泛化极限,UC伯克利系出品

具身智能最大的挑战在于泛化能力,即在陌生环境中正确完成任务。最近,Physical Intelligence推出全新的π0.5 VLA模型,通过异构任务协同训练实现了泛化,各种家务都能拿捏。

来自主题: AI技术研报
7196 点击    2025-05-06 14:29
Sebastian Raschka 新书《从头开始推理》抢先看,揭秘推理模型基础

Sebastian Raschka 新书《从头开始推理》抢先看,揭秘推理模型基础

Sebastian Raschka 新书《从头开始推理》抢先看,揭秘推理模型基础

推理模型发展正盛,著名 AI 技术博主 Sebastian Raschka 也正在写一本关于推理模型工作方式的新书《Reasoning From Scratch》。

来自主题: AI技术研报
7235 点击    2025-05-06 13:58
AI「自我复制」能力曝光!RepliBench警示:大模型正在学会伪造身份

AI「自我复制」能力曝光!RepliBench警示:大模型正在学会伪造身份

AI「自我复制」能力曝光!RepliBench警示:大模型正在学会伪造身份

科幻中AI自我复制失控场景,正成为现实世界严肃的研究课题。英国AISI推出RepliBench基准,分解并评估AI自主复制所需的四大核心能力。测试显示,当前AI尚不具备完全自主复制能力,但在获取资源等子任务上已展现显著进展。

来自主题: AI技术研报
6231 点击    2025-05-06 13:40
「推理革命」爆发100天:DeepSeek-R1复现研究全揭秘!

「推理革命」爆发100天:DeepSeek-R1复现研究全揭秘!

「推理革命」爆发100天:DeepSeek-R1复现研究全揭秘!

本文深入梳理了围绕DeepSeek-R1展开的多项复现研究,系统解析了监督微调(SFT)、强化学习(RL)以及奖励机制、数据构建等关键技术细节。

来自主题: AI技术研报
5861 点击    2025-05-06 10:53
想去哪就去哪!FindAnything:基于CLIP的开放词汇三维建图,实现真正的“按需探索”

想去哪就去哪!FindAnything:基于CLIP的开放词汇三维建图,实现真正的“按需探索”

想去哪就去哪!FindAnything:基于CLIP的开放词汇三维建图,实现真正的“按需探索”

在复杂、未知的现实环境中,传统导航方法往往依赖闭集语义或事先构建的地图,难以实现真正的“按需探索”。为打破这一瓶颈,本文提出了 FindAnything ——一套融合视觉语言模型的对象为中心、开放词汇三维建图与探索系统。

来自主题: AI技术研报
4544 点击    2025-05-06 10:23
成熟的编程智能体,已经学会升级自己的系统了

成熟的编程智能体,已经学会升级自己的系统了

成熟的编程智能体,已经学会升级自己的系统了

编程智能体,几乎成为了 2025 年最热门的话题之一。不管是学术机构还是工业界,都在寻找更高效的落地路径。

来自主题: AI技术研报
7763 点击    2025-05-06 09:13
细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

从人体单图变身高保真3D模型,不知道伤害了多少程序猿头发的行业难题,竟然被港科广团队一招破解了!

来自主题: AI技术研报
6631 点击    2025-05-06 09:01
AGI失控率>90%!MIT教授算出「康普顿常数」,AI地球「夺权率」已锁定?

AGI失控率>90%!MIT教授算出「康普顿常数」,AI地球「夺权率」已锁定?

AGI失控率>90%!MIT教授算出「康普顿常数」,AI地球「夺权率」已锁定?

在这场通往AGI的竞赛中,人类或许正在逐渐走向失控。MIT最新研究指出:即使采用最理想的监督机制,人类成功控制超级智能的概率也仅为52%,而全面失控的风险可能超过90%。

来自主题: AI技术研报
7970 点击    2025-05-04 17:59
DeepSeek开源的文件系统,是如何提升大模型效率的?

DeepSeek开源的文件系统,是如何提升大模型效率的?

DeepSeek开源的文件系统,是如何提升大模型效率的?

在 AI 领域里,大模型通常具有百亿甚至数千亿参数,训练和推理过程对计算资源、存储系统和数据访问效率提出了极高要求。

来自主题: AI技术研报
6105 点击    2025-05-04 17:35
315 行代码构建编程助手,Go大佬揭开智能体的「神秘面纱」

315 行代码构建编程助手,Go大佬揭开智能体的「神秘面纱」

315 行代码构建编程助手,Go大佬揭开智能体的「神秘面纱」

知名 Go 大佬 Thorsten Ball 最近用 315 行代码构建了一个编程智能体,并表示「它运行得非常好」且「没有护城河」(指它并非难以复制)。

来自主题: AI技术研报
5937 点击    2025-05-03 17:31
阿里云通义点金发布DianJin-R1金融领域推理大模型,32B模型荣膺榜首

阿里云通义点金发布DianJin-R1金融领域推理大模型,32B模型荣膺榜首

阿里云通义点金发布DianJin-R1金融领域推理大模型,32B模型荣膺榜首

近日,阿里云通义点金团队与苏州大学携手合作,在金融大语言模型领域推出了突破性的创新成果:DianJin-R1。

来自主题: AI技术研报
7107 点击    2025-05-03 16:21
睡觉也在卷!伯克利Letta新作「睡眠时计算」让推理效率飙升

睡觉也在卷!伯克利Letta新作「睡眠时计算」让推理效率飙升

睡觉也在卷!伯克利Letta新作「睡眠时计算」让推理效率飙升

AI也会偷偷努力了?Letta和UC伯克利的研究者提出「睡眠时计算」技术,能让LLM在空闲时间提前思考,大幅提升推理效率。

来自主题: AI技术研报
6291 点击    2025-05-03 15:51
别再卷数据了,LLM也怕「过劳死」!CMU等揭秘灾难性过度训练

别再卷数据了,LLM也怕「过劳死」!CMU等揭秘灾难性过度训练

别再卷数据了,LLM也怕「过劳死」!CMU等揭秘灾难性过度训练

颠覆LLM预训练认知:预训练token数越多,模型越难调!CMU、斯坦福、哈佛、普林斯顿等四大名校提出灾难性过度训练。

来自主题: AI技术研报
7290 点击    2025-05-03 15:40
AI可以破解AI生成的验证码吗?

AI可以破解AI生成的验证码吗?

AI可以破解AI生成的验证码吗?

技术在进化,验证码也该变得更有人情味一点。

来自主题: AI技术研报
6895 点击    2025-05-03 15:04
CVPR 2025 | 如何稳定且高效地生成个性化的多人图像?ID-Patch带来新解法

CVPR 2025 | 如何稳定且高效地生成个性化的多人图像?ID-Patch带来新解法

CVPR 2025 | 如何稳定且高效地生成个性化的多人图像?ID-Patch带来新解法

扩散模型(Diffusion Models, DMs)如今已成为文本生成图像的核心引擎。凭借惊艳的图像生成能力,它们正悄然改变着艺术创作、广告设计、乃至社交媒体内容的生产方式。

来自主题: AI技术研报
6208 点击    2025-05-03 14:52
浙大&港理工等提出InfiGUI-R1:利用强化学习,让GUI智能体学会规划任务、反思错误

浙大&港理工等提出InfiGUI-R1:利用强化学习,让GUI智能体学会规划任务、反思错误

浙大&港理工等提出InfiGUI-R1:利用强化学习,让GUI智能体学会规划任务、反思错误

当前,多模态大模型驱动的图形用户界面(GUI)智能体在自动化手机、电脑操作方面展现出巨大潜力。然而,一些现有智能体更类似于「反应式行动者」(Reactive Actors),主要依赖隐式推理,面对需要复杂规划和错误恢复的任务时常常力不从心。

来自主题: AI技术研报
6953 点击    2025-05-02 20:21
只要9美元!LoRA+强化学习,DeepSeek 1.5B推理性能暴涨20%

只要9美元!LoRA+强化学习,DeepSeek 1.5B推理性能暴涨20%

只要9美元!LoRA+强化学习,DeepSeek 1.5B推理性能暴涨20%

南加州大学团队只用9美元,就能在数学基准测试AIME 24上实现超过20%的推理性能提升,效果好得离谱!而其核心技术只需LoRA+强化学习,用极简路径实现超高性价比后训练。

来自主题: AI技术研报
7128 点击    2025-05-02 19:57
LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能            机器之心     2025年05月02日 12:39 北京

LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能 机器之心 2025年05月02日 12:39 北京

LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能 机器之心 2025年05月02日 12:39 北京

LoRA 中到底存在多少参数冗余?这篇创新研究介绍了 LoRI 技术,它证明即使大幅减少 LoRA 的可训练参数,模型性能依然保持强劲。

来自主题: AI技术研报
7067 点击    2025-05-02 15:23
CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源

CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源

CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源

Mona(Multi-cognitive Visual Adapter)是一种新型视觉适配器微调方法,旨在打破传统全参数微调(full fine-tuning)在视觉识别任务中的性能瓶颈。

来自主题: AI技术研报
6634 点击    2025-05-02 14:17