AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
能帮你做 Live Photo 了!藏师傅社交卡片 Skill 重磅更新

能帮你做 Live Photo 了!藏师傅社交卡片 Skill 重磅更新

能帮你做 Live Photo 了!藏师傅社交卡片 Skill 重磅更新

前段时间我做了一个 guizang-social-card-skill(https://github.com/op7418/guizang-social-card-skill)。

来自主题: AI技术研报
8562 点击    2026-07-03 10:39
世界模型的新用途:不做选手,去当裁判

世界模型的新用途:不做选手,去当裁判

世界模型的新用途:不做选手,去当裁判

眼下具身赛道都在卷世界模型,都在抢着做机器人的“大脑”。

来自主题: AI技术研报
7776 点击    2026-07-03 10:10
怎么量化机器人数据价值?ATHENA将影响函数扩展到十亿参数VLA,313×加速筛选高价值数据

怎么量化机器人数据价值?ATHENA将影响函数扩展到十亿参数VLA,313×加速筛选高价值数据

怎么量化机器人数据价值?ATHENA将影响函数扩展到十亿参数VLA,313×加速筛选高价值数据

具身智能正在进入数据 scaling 时代。Vision-Language-Action(VLA)模型让机器人可以从大规模示教数据(demonstrations)中学习更通用的操作策略。但对机器人 VLA 训练来说,数据并不总是越多越好:低质量数据可能会拖累模型性能,而每一条 demonstration 都意味着昂贵的人力采集、机器人运行,以及云端存储和训练成本。

来自主题: AI技术研报
9047 点击    2026-07-03 09:48
3个爆火的开源项目,无需API Key的爬虫神器!

3个爆火的开源项目,无需API Key的爬虫神器!

3个爆火的开源项目,无需API Key的爬虫神器!

现在用 AI 做项目,经常会碰到这种尴尬的情况: 写代码,它喜欢乱造轮子,能用十行解决的事,非要写一大坨。

来自主题: AI技术研报
8512 点击    2026-07-03 09:47
一个开源平台,编织起了Agent「互联网」

一个开源平台,编织起了Agent「互联网」

一个开源平台,编织起了Agent「互联网」

在历史长河中,技术的发展很少是一路线性往前走的,很多关键变化发生在「连接」被打通的那一刻。

来自主题: AI技术研报
7746 点击    2026-07-02 15:00
Agent的自演进,被刚刚开源的AReaL 2.0按下了加速键

Agent的自演进,被刚刚开源的AReaL 2.0按下了加速键

Agent的自演进,被刚刚开源的AReaL 2.0按下了加速键

当 Agent 从演示视频中的炫技片段开始走进真实工作流与生产环境,下一阶段的「何去何从」成为业界关注的焦点。

来自主题: AI技术研报
6209 点击    2026-07-02 14:31
ICML26 | 浙江理工大学马啸讲师和南京大学李武军教授课题组联合提出EMCES:为强化学习合成更有价值的样本

ICML26 | 浙江理工大学马啸讲师和南京大学李武军教授课题组联合提出EMCES:为强化学习合成更有价值的样本

ICML26 | 浙江理工大学马啸讲师和南京大学李武军教授课题组联合提出EMCES:为强化学习合成更有价值的样本

近年来,强化学习在游戏智能体、具身智能、大语言模型等领域取得了显著进展。然而,在真实世界中,强化学习仍面临一个核心难题:高质量样本的获取不仅成本高昂,还可能带来多种风险。因此,样本增强成为缓解强化学习中样本获取成本高、风险大等问题的重要途径之一。

来自主题: AI技术研报
9704 点击    2026-07-02 14:31
训练世界模型,开始从人类的肌肉和脑子里偷师了

训练世界模型,开始从人类的肌肉和脑子里偷师了

训练世界模型,开始从人类的肌肉和脑子里偷师了

具身智能数据的竞争,正在从“量大管饱”进入下一关。

来自主题: AI技术研报
5826 点击    2026-07-02 14:29
OceanBase湖库一体,重新定义AI数据库

OceanBase湖库一体,重新定义AI数据库

OceanBase湖库一体,重新定义AI数据库

AI时代苟日新,日日新,又日新,数据库也是如此。

来自主题: AI技术研报
7444 点击    2026-07-02 11:04
AI视觉创作总差点意思?中科大等综述500+篇文献,系统分析生成一致性

AI视觉创作总差点意思?中科大等综述500+篇文献,系统分析生成一致性

AI视觉创作总差点意思?中科大等综述500+篇文献,系统分析生成一致性

扩散模型已经越来越会「画」,却还远没有学会「守住要求」。决定系统是否可靠的,已不再只是画质,而是生成结果能否持续遵守条件、维持状态,并符合人类与现实世界的基本标准。

来自主题: AI技术研报
5476 点击    2026-07-02 11:04
从答题到做实验:SciAgentGym让大模型进入科学工作流

从答题到做实验:SciAgentGym让大模型进入科学工作流

从答题到做实验:SciAgentGym让大模型进入科学工作流

DeepMind 联合创始人、2024 年诺贝尔化学奖得主 Demis Hassabis 曾谈到,他一直将 AI 视为推动知识前沿的重要工具。AI 可以帮助科学家处理复杂数据、发现隐藏模式,也可能在未来参与更深层的科学探索。

来自主题: AI技术研报
5550 点击    2026-07-02 10:35
教程:如何用AutoRAG + Milvus避免RAG 与Agent 中出现串租问题

教程:如何用AutoRAG + Milvus避免RAG 与Agent 中出现串租问题

教程:如何用AutoRAG + Milvus避免RAG 与Agent 中出现串租问题

多租户 RAG 与Agent系统的生产实践中,最致命的事故莫过于数据串租,系统将租户 B 的私有数据作为背景知识,回答了租户 A 的提问。

来自主题: AI技术研报
6620 点击    2026-07-02 10:35
开源「仓颉.Skill」2.0,你现在可以蒸馏任何视频!

开源「仓颉.Skill」2.0,你现在可以蒸馏任何视频!

开源「仓颉.Skill」2.0,你现在可以蒸馏任何视频!

大家好,我是袋鼠帝。 没想到cangjie-skill在4月开源,中间没怎么推,两个月还慢慢涨到了1.3K Star,有点出乎我的意料。

来自主题: AI技术研报
9766 点击    2026-07-01 16:23
邢波再出手:上次「骂」完世界模型,这次轮到智能体了

邢波再出手:上次「骂」完世界模型,这次轮到智能体了

邢波再出手:上次「骂」完世界模型,这次轮到智能体了

去年夏天,MBZUAI 校长、CMU 教授邢波一篇《世界模型批评》吸引了研究社区广泛关注,他从科幻经典《沙丘》里「完美模拟现实」的想象出发,逐一拆解了当下几大世界模型流派的硬伤,提出了一套新架构,也由此引出了他与 Yann LeCun 之间一场关于「世界模型到底该怎么造」的公开辩论。

来自主题: AI技术研报
6783 点击    2026-07-01 15:43
都在卷「让大模型多循环几遍」,这个7B模型LoopCoder v2说:多循环 1 次就够了

都在卷「让大模型多循环几遍」,这个7B模型LoopCoder v2说:多循环 1 次就够了

都在卷「让大模型多循环几遍」,这个7B模型LoopCoder v2说:多循环 1 次就够了

当所有人都在比谁「想得更久、算得更多」——推理模型动辄输出成千上万个思考 token,循环式架构恨不得在内部反复迭代十遍八遍——一项新研究反手泼了盆冷水:

来自主题: AI技术研报
6576 点击    2026-07-01 10:26
清华发布智能体社会AgentSociety第二代:让社会科学研究真正「跑起来」

清华发布智能体社会AgentSociety第二代:让社会科学研究真正「跑起来」

清华发布智能体社会AgentSociety第二代:让社会科学研究真正「跑起来」

AgentSociety²是清华大学团队推出的社会科学研究新工具,通过AI智能体模拟社会行为,帮助研究者构建实验环境,直接运行社会假设。它让AI同时扮演研究助手和实验参与者角色,使复杂社会问题能被构造、运行和分析,提升研究效率与可复现性。

来自主题: AI技术研报
6362 点击    2026-07-01 09:52
破解遥感目标的形状与尺度难题,PKINet二代推理提速近4倍!

破解遥感目标的形状与尺度难题,PKINet二代推理提速近4倍!

破解遥感目标的形状与尺度难题,PKINet二代推理提速近4倍!

卫星和航空影像里的目标,不仅大小相差悬殊,还可能朝向任意方向:一边是细长的桥梁、船舶,一边是密集的小车和大面积运动场。PKINet-v2是一种改进的遥感目标检测模型,能同时处理复杂形状和尺度变化的问题。

来自主题: AI技术研报
6229 点击    2026-07-01 09:50
条条电路通罗马:大模型可解释性的「唯一机制」可能从一开始就不存在

条条电路通罗马:大模型可解释性的「唯一机制」可能从一开始就不存在

条条电路通罗马:大模型可解释性的「唯一机制」可能从一开始就不存在

长期以来,机制可解释性(mechanistic interpretability)领域有一个几乎从未被明说、却被视为理所当然的前提:模型对于同一种任务的能力或表现,背后对应着一条唯一的、或近乎唯一的内部「电路」(circuit)。该领域的研究者们之所以要做「电路发现」(circuit discovery),是为了要把这些「特定的」电路找出来。

来自主题: AI技术研报
7796 点击    2026-06-30 15:12
登顶权威榜单!无界动力发布全球首个「长时序双向物理因果链」隐空间世界模型 MWA™

登顶权威榜单!无界动力发布全球首个「长时序双向物理因果链」隐空间世界模型 MWA™

登顶权威榜单!无界动力发布全球首个「长时序双向物理因果链」隐空间世界模型 MWA™

当前,物理 AI 正面临着关于泛化能力的普遍质疑。当模型缺乏对真实物理规律的深度认知、难以跨越复杂多变的开放场景时,如何让机器人真正理解物理世界并精准规划决策,已成为具身智能破局的关键。

来自主题: AI技术研报
7612 点击    2026-06-30 10:48
AI当老板,快给10家公司干破产了…

AI当老板,快给10家公司干破产了…

AI当老板,快给10家公司干破产了…

AI当「老板」,快给10家公司干破产了……

来自主题: AI技术研报
8033 点击    2026-06-30 10:47
给Transformer变个形,LLM竟能变得更聪明

给Transformer变个形,LLM竟能变得更聪明

给Transformer变个形,LLM竟能变得更聪明

2026 年 6 月,大模型行业正在经历一场前所未有的「开源海啸」:英伟达放出了 550B 参数的混合架构模型,谷歌送出多模态的 Gemma 新版本,智谱用最宽松的协议全量开源了自家旗舰模型。

来自主题: AI技术研报
7736 点击    2026-06-30 10:20