AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
从0到1跑通AI爽剧:超高质量短剧制作全流程SOP直接拿走!【建议收藏】

从0到1跑通AI爽剧:超高质量短剧制作全流程SOP直接拿走!【建议收藏】

从0到1跑通AI爽剧:超高质量短剧制作全流程SOP直接拿走!【建议收藏】

大家好,我是最近疯狂研究短剧的袋鼠帝 最近的AI漫剧发展的是真快啊,各种爽文小说改编的AI漫剧播放量甚至已经超过了某些电影和电视剧。

来自主题: AI技术研报
10025 点击    2026-06-24 16:05
真机强化学习如何保证安全性?清华团队提出安全探索均衡机制

真机强化学习如何保证安全性?清华团队提出安全探索均衡机制

真机强化学习如何保证安全性?清华团队提出安全探索均衡机制

近日清华大学于IEEE TPAMI发表论文,探讨了真机强化学习的安全性保障问题,提出了一套「安全探索均衡」新型机制,揭示了安全探索的理论最大边界,并攻克了其收敛性证明难题。

来自主题: AI技术研报
6597 点击    2026-06-24 16:03
斯坦福改变了LLM的生成顺序,Google把它做了出来。DiffusionGemma技术报告来了

斯坦福改变了LLM的生成顺序,Google把它做了出来。DiffusionGemma技术报告来了

斯坦福改变了LLM的生成顺序,Google把它做了出来。DiffusionGemma技术报告来了

Google DeepMind在6月份对外分享了DiffusionGemma的技术报告,明确指向了一条与现有主流完全不同的演进道路。当大家都在绞尽脑汁让大模型逐词吐字的速度变快时,谷歌干脆把生成顺序改了。

来自主题: AI技术研报
7485 点击    2026-06-24 09:54
如何使用 Codex,进行长程任务

如何使用 Codex,进行长程任务

如何使用 Codex,进行长程任务

这两天在赶工,鞭策 Codex 赶紧把 AGI Bar 的小程序弄出来,已经连续蹬了 80+ 小时了,预估再蹬 20 个小时就能蹬完

来自主题: AI技术研报
7696 点击    2026-06-23 16:46
SCI 论文配图 Prompt 怎么写?这篇直接抄

SCI 论文配图 Prompt 怎么写?这篇直接抄

SCI 论文配图 Prompt 怎么写?这篇直接抄

做科研的人应该都懂,论文配图真的很耗时间。

来自主题: AI技术研报
5645 点击    2026-06-23 15:03
你的AI正在「见人下菜」,亚马逊团队ACL高分论文,首次系统测评「记忆」如何影响LLM情商

你的AI正在「见人下菜」,亚马逊团队ACL高分论文,首次系统测评「记忆」如何影响LLM情商

你的AI正在「见人下菜」,亚马逊团队ACL高分论文,首次系统测评「记忆」如何影响LLM情商

近年来,个性化语言模型迅速普及。 从 ChatGPT、Claude 到各类垂直 agent,用户 “长期记忆” 功能也逐渐成为标配,它们被广泛部署在推荐系统、客户服务、情感陪伴等场景中。

来自主题: AI技术研报
9373 点击    2026-06-23 15:03
从 OpenClaw 到 FastClaw:如何设计优秀的多 Agent 架构

从 OpenClaw 到 FastClaw:如何设计优秀的多 Agent 架构

从 OpenClaw 到 FastClaw:如何设计优秀的多 Agent 架构

做了一年 Agent 基础设施,踩了无数坑,我终于想明白了一件事:好的 Agent 架构不是把所有功能塞进一个进程,而是让每一层都能独立演化。

来自主题: AI技术研报
9994 点击    2026-06-23 09:50
Sakana AI发布模型Fugu Ultra,号称比肩Claude Fable

Sakana AI发布模型Fugu Ultra,号称比肩Claude Fable

Sakana AI发布模型Fugu Ultra,号称比肩Claude Fable

就在所有人还在为Claude Fable 5的突然消失而懵圈时,Sakana AI却高调宣布:我们的Fugu比肩Fable,还不怕出口管制。

来自主题: AI技术研报
6832 点击    2026-06-23 09:33
何恺明团队发布像素空间文生图模型MiniT2I

何恺明团队发布像素空间文生图模型MiniT2I

何恺明团队发布像素空间文生图模型MiniT2I

文本生成图像的领域早已经是一片红海,看上去已经卷无可卷了。

来自主题: AI技术研报
8699 点击    2026-06-22 16:53
不靠专家出题,8万条人类终端录像,炼成首个真实CLI工作流基准TerminalWorld

不靠专家出题,8万条人类终端录像,炼成首个真实CLI工作流基准TerminalWorld

不靠专家出题,8万条人类终端录像,炼成首个真实CLI工作流基准TerminalWorld

AI Agent 正在重塑软件开发。写代码、修 bug,它的能力肉眼可见地往上涨。但软件开发,从来不止 "写代码" 这一件事。装环境、配依赖、部署服务、编排容器、管理云资源、处理安全策略,这些 "让软件活起来" 的脏活累活,才是真实开发的大头。而它们,几乎都发生在同一个地方:终端。

来自主题: AI技术研报
7171 点击    2026-06-22 15:15
清华NANO滤波器:非线性贝叶斯状态估计迈入优化迭代计算的新范式

清华NANO滤波器:非线性贝叶斯状态估计迈入优化迭代计算的新范式

清华NANO滤波器:非线性贝叶斯状态估计迈入优化迭代计算的新范式

NANO滤波器是一种新的非线性贝叶斯状态估计方法,它不依赖线性化模型,而是将预测和更新步骤转化为优化问题。这种方法在高斯分布空间中使用自然梯度,更精确地逼近最优后验,同时利用Stein引理避免显式求导,提升鲁棒性。

来自主题: AI技术研报
7113 点击    2026-06-22 15:15
OpenAI发布最新里程碑:对齐的本质是「人格」

OpenAI发布最新里程碑:对齐的本质是「人格」

OpenAI发布最新里程碑:对齐的本质是「人格」

就在最近,OpenAI扔出一篇重磅论文。他们发现,只教AI好好看病,它写代码居然也不作弊了。方法简单到离谱:拿5%的训练数据,教模型在回答健康问题时诚实、谨慎、知错能改。

来自主题: AI技术研报
7741 点击    2026-06-21 11:31
你以为是 AI 在干活,其实那个循环一直是你——一个 OpenAI 员工聊 loop engineering

你以为是 AI 在干活,其实那个循环一直是你——一个 OpenAI 员工聊 loop engineering

你以为是 AI 在干活,其实那个循环一直是你——一个 OpenAI 员工聊 loop engineering

OpenAI 的 tevfik 写了篇关于 loop engineering 的文章,开头那句我读完顿了一下。他说,他和 coding agent 协作,到现在大多还是同一个流程:我解释一个任务,等结果,审一遍,再发下一条指令。代码是 agent 写的,但我在后台还干着另一份活——我记着发生了什么、决定下一步做什么、判断这事到底完成没。

来自主题: AI技术研报
7450 点击    2026-06-21 10:59
斯坦福报告:中国自主培养,顶尖AI人才崛起

斯坦福报告:中国自主培养,顶尖AI人才崛起

斯坦福报告:中国自主培养,顶尖AI人才崛起

斯坦福胡佛研究所追踪了 DeepSeek 七篇论文背后 356 名研究者的完整职业轨迹。美国培养出的最优秀 AI 人才正在大规模回流中国,而中国本土管道已经能独立产出前沿模型的核心贡献者。

来自主题: AI技术研报
9473 点击    2026-06-21 10:44
从“一句成片”到“长轨推演”:探究多模态智能体在长视频编辑中的应用

从“一句成片”到“长轨推演”:探究多模态智能体在长视频编辑中的应用

从“一句成片”到“长轨推演”:探究多模态智能体在长视频编辑中的应用

近年来,大语言模型(LLMs)在长篇视觉叙事中展现出卓越潜力,生产方式正迅速从单一模型生成转向面向生产的智能体系统。但长视频剪辑仍然是一个极难控制的长期任务。模型有时会在缺乏素材依据的情况下强行生成,甚至在面对明显断档的转场或人物不一致时依然“盲目拼接”。

来自主题: AI技术研报
9758 点击    2026-06-21 10:41
AI接管数字世界!华为Claw-Anything:面向跨设备、跨时间、跨服务的Claw评测与数据引擎

AI接管数字世界!华为Claw-Anything:面向跨设备、跨时间、跨服务的Claw评测与数据引擎

AI接管数字世界!华为Claw-Anything:面向跨设备、跨时间、跨服务的Claw评测与数据引擎

我们相信,常驻型 (always-on) AI 助理的下一次飞跃,不在于把某一个模型单点调得更聪明,而在于扩展智能体的上下文 (Scaling Agent Context)—— 不断拓宽助理能够持续 "感知 — 推理 — 执行" 的范围,作为生活连接器连接用户的信息孤岛,直到它能接管用户的整个数字世界。

来自主题: AI技术研报
7994 点击    2026-06-21 10:34
沿着何恺明团队「漂移模型」再走一步:奖励只需排名,单步文生图偏好优化提速3.51倍

沿着何恺明团队「漂移模型」再走一步:奖励只需排名,单步文生图偏好优化提速3.51倍

沿着何恺明团队「漂移模型」再走一步:奖励只需排名,单步文生图偏好优化提速3.51倍

来自西湖大学和香港中文大学(深圳)的团队沿着这一思路提出 Drifting Preference Optimization(DrPO),把漂移场用于单步文生图模型的偏好后训练。在 DrPO 中,奖励只负责对候选图像排序,不参与反向传播。具体而言,针对同一个文本提示词,当前模型生成一组候选图像。高分样本在特征空间中产生吸引,低分样本产生排斥,并结合参考模型约束给出模型的更新方向。

来自主题: AI技术研报
7557 点击    2026-06-21 10:33
CameraSquad:精准运镜,多视角一致——视频世界模型的空间智能新范式

CameraSquad:精准运镜,多视角一致——视频世界模型的空间智能新范式

CameraSquad:精准运镜,多视角一致——视频世界模型的空间智能新范式

如今,CameraSquad 的出现,让这种多视角一致的视频生成与 3D 世界状态构建成为现实。近日,中国科学院大学高林研究员团队联合卡迪夫大学、香港科技大学和快手可灵团队,提出了一种面向多轨迹并行生成的相机可控视频生成方法 CameraSquad [1],相关论文已被 ACM SIGGRAPH 2026 录用。

来自主题: AI技术研报
7607 点击    2026-06-21 10:32