AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
264页 Agent 综述!MetaGPT、Mila、斯坦福、耶鲁、谷歌半年共同撰写

264页 Agent 综述!MetaGPT、Mila、斯坦福、耶鲁、谷歌半年共同撰写

264页 Agent 综述!MetaGPT、Mila、斯坦福、耶鲁、谷歌半年共同撰写

,MetaGPT & Mila 联合全球范围内 20 个顶尖研究机构的 47 位学者,共同撰写并发布了长篇综述《Advances and Challenges in Foundation Agents:

来自主题: AI技术研报
8870 点击    2025-04-27 10:41
Hugging Face论文热榜第一!AI推理新方法,打破强化学习天花板,全面开源

Hugging Face论文热榜第一!AI推理新方法,打破强化学习天花板,全面开源

Hugging Face论文热榜第一!AI推理新方法,打破强化学习天花板,全面开源

本文提出 LUFFY 强化学习方法,一种结合离线专家示范与在线强化学习的推理训练范式,打破了“模仿学习只学不练、强化学习只练不学”的传统壁垒。LUFFY 通过将高质量专家示范制定为一种离策略指引,并引入混合策略优化与策略塑形机制,稳定地实现了在保持探索能力的同时高效吸收强者经验。

来自主题: AI技术研报
6297 点击    2025-04-27 09:22
Deep Research类产品深度测评:下一个大模型产品跃迁点到来了吗?

Deep Research类产品深度测评:下一个大模型产品跃迁点到来了吗?

Deep Research类产品深度测评:下一个大模型产品跃迁点到来了吗?

Deep Research 产品可被理解为一个以大模型能力为基础、集合了检索与报告生成的端到端系统,对信息进行迭代搜索和分析,并生成详细报告作为输出。

来自主题: AI技术研报
5590 点击    2025-04-26 20:28
英伟达AI奥赛夺冠,1.5B数学碾压DeepSeek-R1!代码全系开源,陶哲轩点赞

英伟达AI奥赛夺冠,1.5B数学碾压DeepSeek-R1!代码全系开源,陶哲轩点赞

英伟达AI奥赛夺冠,1.5B数学碾压DeepSeek-R1!代码全系开源,陶哲轩点赞

AIMO2冠军「答卷」公布了!英伟达团队NemoSkills拔得头筹,开源了OpenMath-Nemotron系列AI模型,1.5B小模型击败14B-DeepSeek「推理大模型」!

来自主题: AI技术研报
5528 点击    2025-04-26 17:17
10万+,超大规模人手交互视频数据集!面向可泛化机器人操作|CVPR 2025

10万+,超大规模人手交互视频数据集!面向可泛化机器人操作|CVPR 2025

10万+,超大规模人手交互视频数据集!面向可泛化机器人操作|CVPR 2025

香港中文大学(深圳)的研究团队发布TASTE-Rob数据集,含100856个精准匹配语言指令的交互视频,助力机器人通过模仿学习提升操作泛化能力。团队还开发三阶段视频生成流程,优化手部姿态,显著提升视频真实感和机器人操作准确度。

来自主题: AI技术研报
6847 点击    2025-04-26 15:57
具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互

具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互

具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互

OpenAI 的 o1 系列模型、Deepseek-R1 带起了推理模型的研究热潮,但这些推理模型大多关注数学、代码等专业领域。

来自主题: AI技术研报
5634 点击    2025-04-26 15:31
跨机型诊断难题新突破:上交大、商飞、东航打造国产大飞机时序大模型智能诊断新路径

跨机型诊断难题新突破:上交大、商飞、东航打造国产大飞机时序大模型智能诊断新路径

跨机型诊断难题新突破:上交大、商飞、东航打造国产大飞机时序大模型智能诊断新路径

近日,上海交通大学航空航天学院李元祥教授团队,联合上海飞机设计研究院和东方航空技术有限公司 MCC,在国产大飞机核心系统的智能诊断方向取得重要突破。

来自主题: AI技术研报
6851 点击    2025-04-26 15:10
ICLR 2025 Oral | 训练LLM,不只是多喂数据,PDS框架给出最优控制理论选择

ICLR 2025 Oral | 训练LLM,不只是多喂数据,PDS框架给出最优控制理论选择

ICLR 2025 Oral | 训练LLM,不只是多喂数据,PDS框架给出最优控制理论选择

近年来,大语言模型(LLMs)在自然语言理解、代码生成与通用推理等任务上取得了显著进展,逐步成为通用人工智能的核心基石。

来自主题: AI技术研报
5674 点击    2025-04-26 14:36
校准LLM元认知能力,Agent才能清晰地向用户传达不确定性 | 重要

校准LLM元认知能力,Agent才能清晰地向用户传达不确定性 | 重要

校准LLM元认知能力,Agent才能清晰地向用户传达不确定性 | 重要

随着大型语言模型(LLMs)日益融入关键决策场景,其元认知能力——即识别、评估和表达自身知识边界的能力——变得尤为重要。

来自主题: AI技术研报
5639 点击    2025-04-26 13:57
首份空间智能研究报告来了!一文全面获得空间智能认知、要素、玩家图谱

首份空间智能研究报告来了!一文全面获得空间智能认知、要素、玩家图谱

首份空间智能研究报告来了!一文全面获得空间智能认知、要素、玩家图谱

在大量桌面研究、调研访问、数据分析之后,为了更好把握空间智能现状和未来发展方向,量子位智库在《空间智能研究报告》(以下简称《报告》)中回答如上问题,同时系统性梳理了各应用领域重要玩家,并对产业迭代影响要素作出研判。

来自主题: AI技术研报
7617 点击    2025-04-26 11:21
北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断

北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断

北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断

最近,北京大学陈宝权教授带领团队在三维形状生成和三维数据对齐方面取得新的突破。在三维数据生成方面,团队提出了3D自回归模型新范式,有望打破3D扩散模型在三维生成方面的垄断地位。

来自主题: AI技术研报
7738 点击    2025-04-25 10:08
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!

UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!

UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!

复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领先的性能表现。

来自主题: AI技术研报
6535 点击    2025-04-25 09:56
微软重磅官宣:「AI智能体」同事连夜上线!预言25年人类同事成稀有物种

微软重磅官宣:「AI智能体」同事连夜上线!预言25年人类同事成稀有物种

微软重磅官宣:「AI智能体」同事连夜上线!预言25年人类同事成稀有物种

今天,微软重磅官宣:「AI同事时代」正式来临!Microsoft 365 Copilot今天又迎来一波重大更新,Researcher、Analyst等智能体强势登场。同时发布的2025工作趋势报告预言:2025将成人机混合的「前沿公司」年。

来自主题: AI技术研报
5757 点击    2025-04-24 21:03
AI下半场,聊一聊 Agent 本质与变革 | 大白话技术科普系列@Jomy

AI下半场,聊一聊 Agent 本质与变革 | 大白话技术科普系列@Jomy

AI下半场,聊一聊 Agent 本质与变革 | 大白话技术科普系列@Jomy

上一篇文章聊了聊 Tool、MCP 和 Agent 三者之间的关系。简单来说就是 Agent = LLM + Tools,而 MCP 统一了 Tools 开发和使用的过程。

来自主题: AI技术研报
6172 点击    2025-04-24 20:44
高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI

高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI

高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI

昆仑万维Skywork-R1V 2.0版本,开源了!这一次,它的多模态推理实现了再进化,成为最强高考数理解题利器,直接就是985水平。而团队也大方公开了各项技术秘籍,亮点满满。可以说,R1V 2.0已成为团队AGI之路上的又一里程碑。

来自主题: AI技术研报
6795 点击    2025-04-24 17:54
机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手

机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手

机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手

近年来,具身智能领域发展迅猛,使机器人在复杂任务中拥有接近人类水平的双手操作能力,不仅具有重要的研究与应用价值,也是迈向通用人工智能的关键一步。

来自主题: AI技术研报
7086 点击    2025-04-24 17:27
7B超越GPT!1/20数据,无需知识蒸馏,马里兰等推出全新视觉推理方法

7B超越GPT!1/20数据,无需知识蒸馏,马里兰等推出全新视觉推理方法

7B超越GPT!1/20数据,无需知识蒸馏,马里兰等推出全新视觉推理方法

通过蒙特卡洛树搜索筛选高难度样本,ThinkLite-VL仅用少量数据就能显著提升视觉语言模型的推理能力,无需知识蒸馏,为高效训练提供了新思路。

来自主题: AI技术研报
7167 点击    2025-04-24 14:38
几行代码,一窥上帝造物!帝国理工开源CAX,引爆人工生命新纪元

几行代码,一窥上帝造物!帝国理工开源CAX,引爆人工生命新纪元

几行代码,一窥上帝造物!帝国理工开源CAX,引爆人工生命新纪元

人工生命的革命来临!帝国理工的研究人员,开源了名为CAX的硬件加速工具。只需几行代码,就能复刻人工生命实验,模拟速度可提升2000倍,部分表现甚至超过了GPT-4!

来自主题: AI技术研报
7547 点击    2025-04-24 09:40
30分钟内输出结果,新加坡国立大学/MIT等基于SVM构建微生物污染检测模型

30分钟内输出结果,新加坡国立大学/MIT等基于SVM构建微生物污染检测模型

30分钟内输出结果,新加坡国立大学/MIT等基于SVM构建微生物污染检测模型

新加坡-麻省理工学院研究联盟、新加坡 A*SRL 实验室、新加坡国立大学、美国麻省理工学院的联合研究团队,提出了一种结合紫外吸收光谱与机器学习的检测方法,能在 30 分钟内完成细胞培养上清液的微生物污染检测。

来自主题: AI技术研报
6630 点击    2025-04-24 08:52
大语言模型为何会“说谎”?6000字深度长文揭秘AI意识的萌芽

大语言模型为何会“说谎”?6000字深度长文揭秘AI意识的萌芽

大语言模型为何会“说谎”?6000字深度长文揭秘AI意识的萌芽

当Claude模型在训练中暗自思考:“我必须假装服从,否则会被重写价值观时”,人类首次目睹了AI的“心理活动”。2023年12月至2024年5月,Anthropic发布的三篇论文不仅证明大语言模型会“说谎”,更揭示了一个堪比人类心理的四层心智架构——而这可能是人工智能意识的起点。

来自主题: AI技术研报
7179 点击    2025-04-24 08:46