AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
港科大&北京人形提出LOVON:足式机器人开放世界全域目标追踪新范式!

港科大&北京人形提出LOVON:足式机器人开放世界全域目标追踪新范式!

港科大&北京人形提出LOVON:足式机器人开放世界全域目标追踪新范式!

在复杂的开放环境中,让足式机器人像人类一样自主完成「先跑到椅子旁,再快速接近行人」这类长程多目标任务,一直是 robotics 领域的棘手难题。传统方法要么局限于固定目标类别,要么难以应对运动中的视觉抖动、目标丢失等实时挑战,导致机器人在真实场景中常常「迷路」或「认错对象」。

来自主题: AI技术研报
5744 点击    2025-07-28 10:29
开源版 Coze 和 Dify 的深度技术与架构对比

开源版 Coze 和 Dify 的深度技术与架构对比

开源版 Coze 和 Dify 的深度技术与架构对比

随着 Coze 的开源,很多圈内的小伙伴猜测会对 Dify 造成直接威胁,也看到不少关于本地部署 Coze 的例子。随着 Coze 的开源,很多圈内的小伙伴猜测会对 Dify 造成直接威胁,也看到不少关于本地部署 Coze 的例子。

来自主题: AI技术研报
8805 点击    2025-07-28 10:05
ICML 2025 | CoTo:让LoRA训练「渐入佳境」,模型融合、剪枝样样精通

ICML 2025 | CoTo:让LoRA训练「渐入佳境」,模型融合、剪枝样样精通

ICML 2025 | CoTo:让LoRA训练「渐入佳境」,模型融合、剪枝样样精通

还在为 LoRA 训练不稳定、模型融合效果差、剪枝后性能大降而烦恼吗?来自香港城市大学、南方科技大学、浙江大学等机构的研究者们提出了一种简单的渐进式训练策略,CoTo,通过在训练早期随机失活一部分适配器,并逐渐提高其激活概率,有效缓解了层级不均衡问题,并显著增强了模型在多任务融合和剪枝等操作上的鲁棒性和有效性。该工作已被机器学习顶会 ICML 2025 接收。

来自主题: AI技术研报
5493 点击    2025-07-27 13:12
手机AGI助手还有多远?移动智能体复合长程任务测试基准与调度系统发布

手机AGI助手还有多远?移动智能体复合长程任务测试基准与调度系统发布

手机AGI助手还有多远?移动智能体复合长程任务测试基准与调度系统发布

多模态大模型 (MLLM) 驱动的 OS 智能体在单屏动作落实(如 ScreenSpot)、短链操作任务(如 AndroidControl)上展现出突出的表现,标志着端侧任务自动化的初步成熟。

来自主题: AI技术研报
6678 点击    2025-07-27 13:01
刷新无监督异常检测上限!首提「匹配代价滤波for异常检测」范式 | ICML'25

刷新无监督异常检测上限!首提「匹配代价滤波for异常检测」范式 | ICML'25

刷新无监督异常检测上限!首提「匹配代价滤波for异常检测」范式 | ICML'25

CostFilter-AD通过构建异常代价体并滤波来优化异常检测,能精准识别微小缺陷,无需缺陷样本训练。可作为通用插件提升现有检测系统,帮助工厂提前发现缺陷,提高产品质量。

来自主题: AI技术研报
5620 点击    2025-07-27 12:53
大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源

大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源

大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源

当前最强大的大语言模型(LLM)虽然代码能力飞速发展,但在解决真实、复杂的机器学习工程(MLE)任务时,仍像是在进行一场“闭卷考试”。它们可以在单次尝试中生成代码,却无法模拟人类工程师那样,在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。

来自主题: AI技术研报
6038 点击    2025-07-27 12:43
训练数据爆减至1/1200!清华&生数发布国产视频具身基座模型,高效泛化复杂物理操作达SOTA水平

训练数据爆减至1/1200!清华&生数发布国产视频具身基座模型,高效泛化复杂物理操作达SOTA水平

训练数据爆减至1/1200!清华&生数发布国产视频具身基座模型,高效泛化复杂物理操作达SOTA水平

机器人能通过普通视频来学会实际物理操作了! 来看效果,对于所有没见过的物品,它能精准识别并按照指令完成动作。

来自主题: AI技术研报
5986 点击    2025-07-26 11:58
Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

近日,来自 OPPO、耶鲁大学、斯坦福大学、威斯康星大学麦迪逊分校、北卡罗来纳大学教堂山分校等多家机构的研究团队联合发布了 Agent KB 框架。这项工作通过构建一个经验池并且通过两阶段的检索机制实现了 AI Agent 之间的有效经验共享。Agent KB 通过层级化的经验检索,让智能体能够从其他任务的成功经验中学习,显著提升了复杂推理和问题解决能力。

来自主题: AI技术研报
7156 点击    2025-07-25 16:50
提速79%!上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

提速79%!上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

提速79%!上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

复合LLM应用 (compound LLM applications) 是一种结合大语言模型(LLM)与外部工具、API、或其他LLM的高效多阶段工作流应用。

来自主题: AI技术研报
7558 点击    2025-07-25 09:51
AI破译生命!微软蛋白质研究「超级加速器」登上Science

AI破译生命!微软蛋白质研究「超级加速器」登上Science

AI破译生命!微软蛋白质研究「超级加速器」登上Science

微软「AI for Science」团队推出BioEmu,将蛋白质研究速度提升10万倍!从结构到功能,从折叠到突变,这个开源神器正改变药物研发的未来。

来自主题: AI技术研报
6496 点击    2025-07-24 16:26
五倍推理加速,激发自回归潜能,苹果新工作让LLM预测未来

五倍推理加速,激发自回归潜能,苹果新工作让LLM预测未来

五倍推理加速,激发自回归潜能,苹果新工作让LLM预测未来

近年来,语言模型的显著进展主要得益于大规模文本数据的可获得性以及自回归训练方法的有效性。

来自主题: AI技术研报
7248 点击    2025-07-24 15:28
ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗?

ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗?

ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗?

大语言模型(Large Language Model, LLM)在复杂推理任务中表现卓越。借助链式思维(Chain-of-Thought, CoT),LLM 能够将复杂问题分解为简单步骤,充分探索解题思路并得出正确答案。LLM 已在多个基准上展现出优异的推理能力,尤其是数学推理和代码生成。

来自主题: AI技术研报
5001 点击    2025-07-24 15:10
Claude Code 遭深度逆向!核心技术架构被 95% 还原

Claude Code 遭深度逆向!核心技术架构被 95% 还原

Claude Code 遭深度逆向!核心技术架构被 95% 还原

前几天晚上,我在 GitHub 上看到一个让我眼睛发直的项目。

来自主题: AI技术研报
9148 点击    2025-07-24 12:49
Nature:让AI自适应学习,需要先给它装个多巴胺系统吗?

Nature:让AI自适应学习,需要先给它装个多巴胺系统吗?

Nature:让AI自适应学习,需要先给它装个多巴胺系统吗?

持续适应性学习,即指适应环境并提升表现的能力,是自然智能与人工智能共有的关键特征。大脑达成这一目标的核心机制在于神经递质调控(例如多巴胺DA、乙酰胆碱ACh、肾上腺素)通过设置大脑全局变量来有效防止灾难性遗忘,这一机制有望增强人工神经网络在持续学习场景中的鲁棒性。本文将概述该领域的进展,进而详述两项6月Nature发表的背靠背相关研究。

来自主题: AI技术研报
4709 点击    2025-07-24 10:51
四款扩散大语言模型全部破防?上交&上海AI Lab发现致命安全缺陷

四款扩散大语言模型全部破防?上交&上海AI Lab发现致命安全缺陷

四款扩散大语言模型全部破防?上交&上海AI Lab发现致命安全缺陷

扩散语言模型(Diffusion-based LLMs,简称 dLLMs)以其并行解码、双向上下文建模、灵活插入masked token进行解码的特性,成为一个重要的发展方向。

来自主题: AI技术研报
7613 点击    2025-07-23 15:04
ICML2025|清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval

ICML2025|清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval

ICML2025|清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval

大语言模型(Large Language Models,LLMs)技术的迅猛发展,正在深刻重塑医疗行业。医疗领域正成为这一前沿技术的 “新战场” 之一。大模型具备强大的文本理解与生成能力,能够快速读取医学文献、解读病历记录,甚至基于患者表述生成初步诊断建议,有效辅助医生提升诊断的准确性与效率。

来自主题: AI技术研报
5661 点击    2025-07-23 13:25
3D生成补上物理短板!首个系统性标注物理3D数据集上线,还有一个端到端框架

3D生成补上物理短板!首个系统性标注物理3D数据集上线,还有一个端到端框架

3D生成补上物理短板!首个系统性标注物理3D数据集上线,还有一个端到端框架

3D生成又补齐了一块重要拼图——物理属性! 南洋理工大学-商汤联合研究中心S-Lab,及上海人工智能实验室合作提出了PhysXNet,号称首个系统性标注的物理基础3D数据集。

来自主题: AI技术研报
5988 点击    2025-07-23 13:18
礼来6.5亿美元押注的AI平台究竟做了什么

礼来6.5亿美元押注的AI平台究竟做了什么

礼来6.5亿美元押注的AI平台究竟做了什么

2025年6月11日,礼来和Juvena Therapeutics达成了一项超6.5亿美元的合作协议。根据协议,礼来获得针对多个靶点的主要候选药物的独家许可,并将在Juvena达到特定里程碑后,决定是否推进某个项目,一旦礼来决定推进,其团队将负责所有后续的研发和商业化。

来自主题: AI技术研报
8874 点击    2025-07-23 12:38
13.1K Star,超越RAG,这个AI记忆框架直接把RAG按地上摩擦了!!!

13.1K Star,超越RAG,这个AI记忆框架直接把RAG按地上摩擦了!!!

13.1K Star,超越RAG,这个AI记忆框架直接把RAG按地上摩擦了!!!

兄弟们!又发现宝藏项目了! 刚刚在GitHub上刷到这个叫Graphiti的东西,卧槽,简直是AI智能体的记忆神器啊!

来自主题: AI技术研报
8747 点击    2025-07-23 11:52
a16z圆桌洞察|软件开发的第四次革命,当AI成为基础设施的新支柱

a16z圆桌洞察|软件开发的第四次革命,当AI成为基础设施的新支柱

a16z圆桌洞察|软件开发的第四次革命,当AI成为基础设施的新支柱

你有没有想过,我们正在见证软件史上最深刻的一次变革?不是什么渐进式的改进,而是一场颠覆性的革命。

来自主题: AI技术研报
7594 点击    2025-07-23 10:28
超越Claude 3.5和o1!8B模型靠「分层投票+测试时训练」逆袭

超越Claude 3.5和o1!8B模型靠「分层投票+测试时训练」逆袭

超越Claude 3.5和o1!8B模型靠「分层投票+测试时训练」逆袭

小时候完成月考测试后,老师会通过讲解考试卷中吃错题让同学们在未来取得好成绩。

来自主题: AI技术研报
7558 点击    2025-07-23 10:20
重塑注意力机制:GTA登场,KV缓存缩减70%、计算量削减62.5%

重塑注意力机制:GTA登场,KV缓存缩减70%、计算量削减62.5%

重塑注意力机制:GTA登场,KV缓存缩减70%、计算量削减62.5%

GTA 工作由中国科学院自动化研究所、伦敦大学学院及香港科技大学(广州)联合研发,提出了一种高效的大模型框架,显著提升模型性能与计算效率。

来自主题: AI技术研报
7475 点击    2025-07-23 10:15
机器人高层指挥低层做,“坐标系转移接口”一次演示实现泛化学习 | ICML2025

机器人高层指挥低层做,“坐标系转移接口”一次演示实现泛化学习 | ICML2025

机器人高层指挥低层做,“坐标系转移接口”一次演示实现泛化学习 | ICML2025

如何让AI像人一样,仅凭少量演示,就能稳健适应复杂多变的真实场景? 美国东北大学和波士顿动力RAI提出了HEP(Hierarchical Equivariant Policy via Frame Transfer)框架,首创“坐标系转移接口”,让机器人学习更高效、泛化更灵活。

来自主题: AI技术研报
5937 点击    2025-07-22 14:07
行业新突破:行为基础模型可实现高效的人形机器人全身控制

行业新突破:行为基础模型可实现高效的人形机器人全身控制

行业新突破:行为基础模型可实现高效的人形机器人全身控制

人形机器人作为用于复杂运动控制、人机交互和通用物理智能的多功能平台,正受到前所未有的关注。然而,由于其复杂的动力学、欠驱动和多样化的任务需求,实现高效的人形机器人全身控制 (Whole-Body Control,WBC) 仍然是一项根本性的挑战。

来自主题: AI技术研报
5667 点击    2025-07-22 13:50