AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
谷歌4D世界模型来了,比SOTA快300倍!

谷歌4D世界模型来了,比SOTA快300倍!

谷歌4D世界模型来了,比SOTA快300倍!

谷歌 DeepMind 发布 D4RT,彻底颠覆了动态 4D 重建范式。它抛弃了复杂的传统流水线,用一个统一的「时空查询」接口,同时搞定全像素追踪、深度估计与相机位姿。不仅精度屠榜,速度更比现有 SOTA 快出 300 倍。这是具身智能与自动驾驶以及 AR 的新基石,AI 终于能像人类一样,实时看懂这个流动的世界。

来自主题: AI技术研报
7751 点击    2026-01-23 16:24
奖励模型变天!0.005%参数量推理速度翻倍,性能还更强

奖励模型变天!0.005%参数量推理速度翻倍,性能还更强

奖励模型变天!0.005%参数量推理速度翻倍,性能还更强

最新奖励模型SWIFT直接利用模型生成过程中的隐藏状态,参数规模极小,仅占传统模型的不到0.005%。SWIFT在多个基准测试中表现优异,推理速度提升1.7×–6.7×,且在对齐评估中稳定可靠,展现出高效、通用的奖励建模新范式。

来自主题: AI技术研报
6602 点击    2026-01-23 15:17
图灵奖得主Bengio斩获AAAI 2026大奖!5篇杰出论文,华人占3篇

图灵奖得主Bengio斩获AAAI 2026大奖!5篇杰出论文,华人占3篇

图灵奖得主Bengio斩获AAAI 2026大奖!5篇杰出论文,华人占3篇

AAAI 2026「七龙珠」,华人团队强势霸榜!从视觉重建到因果发现,再到知识嵌入传承,新一代AI基石正在新加坡闪耀。

来自主题: AI技术研报
9080 点击    2026-01-23 10:15
AAAI'26 Oral:小样本对齐人类认知,LLM不再模仿答案

AAAI'26 Oral:小样本对齐人类认知,LLM不再模仿答案

AAAI'26 Oral:小样本对齐人类认知,LLM不再模仿答案

GEM框架利用认知科学原理,从少量人类偏好中提取多维认知评估,让AI在极少标注下精准理解人类思维,提高了数据效率,在医疗等专业领域表现优异,为AI与人类偏好对齐提供新思路。

来自主题: AI技术研报
8923 点击    2026-01-23 10:14
视频理解+开放网络搜索=首个视频Deep Research评测基准

视频理解+开放网络搜索=首个视频Deep Research评测基准

视频理解+开放网络搜索=首个视频Deep Research评测基准

现有的多模态模型往往被困在「视频」的孤岛里——它们只能回答视频内的问题。但在真实世界中,人类解决问题往往是「看视频找线索 -> 上网搜证 -> 综合推理」。

来自主题: AI技术研报
10162 点击    2026-01-22 16:10
AI for Science开年新突破:中科大实现多尺度结构逆向设计128倍加速,登上Nature子刊

AI for Science开年新突破:中科大实现多尺度结构逆向设计128倍加速,登上Nature子刊

AI for Science开年新突破:中科大实现多尺度结构逆向设计128倍加速,登上Nature子刊

近日,中国科学技术大学(USTC)联合新疆师范大学、中关村人工智能研究院、香港理工大学,在数据驱动的多功能双连通多尺度结构逆向设计领域取得重要突破。

来自主题: AI技术研报
7151 点击    2026-01-22 10:12
你们问了一万遍的票据风图片提示词,它终于来了!

你们问了一万遍的票据风图片提示词,它终于来了!

你们问了一万遍的票据风图片提示词,它终于来了!

我经常一种票据风格的提示词帮我的内容生成图片,很多朋友一直问啥时候发。

来自主题: AI技术研报
7752 点击    2026-01-22 10:12
AI用3年时光,来了解你!首个AI Clone长期记忆基准

AI用3年时光,来了解你!首个AI Clone长期记忆基准

AI用3年时光,来了解你!首个AI Clone长期记忆基准

现有AI记忆评测存在局限,如数据源单一、忽视变化本质、注入成本高等。CloneMem通过层次化生成框架构建合成人生,设计贴近真实场景的评测任务,涵盖多种问题类型。

来自主题: AI技术研报
10091 点击    2026-01-22 10:11
AgentIF-OneDay 发布,评估全场景长时复杂任务

AgentIF-OneDay 发布,评估全场景长时复杂任务

AgentIF-OneDay 发布,评估全场景长时复杂任务

随着大模型在单点推理上日益逼近 PhD 水平,Agent 领域迎来了新的分水岭:短程任务表现惊艳,长程任务却显乏力。为精准评估大模型的多模态理解与复杂问题解决能力,红杉中国在两周内连续发布两篇论文,旨在通过构建更科学的评估基准,预判技术演进的未来方向。

来自主题: AI技术研报
8202 点击    2026-01-22 10:06
中国团队首次在Nature子刊发布医疗AI标准,未来医生MedGPT摘得全球桂冠

中国团队首次在Nature子刊发布医疗AI标准,未来医生MedGPT摘得全球桂冠

中国团队首次在Nature子刊发布医疗AI标准,未来医生MedGPT摘得全球桂冠

中国团队首次在全球顶尖期刊发表“大模型+医疗”领域的相关标准研究! 作为Nature体系中专注于数字医疗的旗舰期刊,《npj Digital Medicine》(JCR影响因子15.1,中科院医学大类1区Top期刊)此次收录的CSEDB研究,首次提出了一套用于评估医疗大模型真实临床能力的系统性框架。

来自主题: AI技术研报
7531 点击    2026-01-21 17:34
学术海报不用愁,一句话精准自动编辑,华东师大开源APEX

学术海报不用愁,一句话精准自动编辑,华东师大开源APEX

学术海报不用愁,一句话精准自动编辑,华东师大开源APEX

华东师范大学Planing Lab提出APEX框架,通过自然语言指令实现学术海报的局部可控编辑,并引入「审查—调整」机制提升编辑可靠性。

来自主题: AI技术研报
5782 点击    2026-01-21 16:10
世界模型+强化学习=具身智能性能翻倍!清华&加州伯克利最新开源

世界模型+强化学习=具身智能性能翻倍!清华&加州伯克利最新开源

世界模型+强化学习=具身智能性能翻倍!清华&加州伯克利最新开源

在具身智能(Embodied AI)的快速发展中,样本效率已成为制约智能体从实验室环境走向复杂开放世界的瓶颈问题。

来自主题: AI技术研报
10278 点击    2026-01-21 16:09
Ralph + Codex CLI:我当老板,AI当监工,GPT-5.2当牛马的正确姿势

Ralph + Codex CLI:我当老板,AI当监工,GPT-5.2当牛马的正确姿势

Ralph + Codex CLI:我当老板,AI当监工,GPT-5.2当牛马的正确姿势

这两天都在研究 ralph,一个你睡觉时,都能不眠不休替你干需求、榨干任何 Coding Agent 的工具。

来自主题: AI技术研报
5878 点击    2026-01-21 16:07
小白 Vibe Coding 发行全平台&可变现应用指南

小白 Vibe Coding 发行全平台&可变现应用指南

小白 Vibe Coding 发行全平台&可变现应用指南

Youware 更新的 Youbase 和 Coview 能力非常牛皮,直接把 Vibe Coding 门槛拉低一万倍。

来自主题: AI技术研报
9985 点击    2026-01-21 16:06
MiniMax把自家“实习生”放出来了!

MiniMax把自家“实习生”放出来了!

MiniMax把自家“实习生”放出来了!

曾经那些将需求、设计与代码强行割裂的流水线,正在快速消融。

来自主题: AI技术研报
9780 点击    2026-01-21 16:05
Skills也能自进化:Claudeception把你的踩坑经验自动变成Skills |CC直接用

Skills也能自进化:Claudeception把你的踩坑经验自动变成Skills |CC直接用

Skills也能自进化:Claudeception把你的踩坑经验自动变成Skills |CC直接用

这不是一个普通的Skill,而是一把“把经验变成Skill”的工具:Claudeception是一个Meta-Skill,即专门用来“生产技能”的技能。

来自主题: AI技术研报
5878 点击    2026-01-21 12:05
从「能用」到「好用」:数据可视化的三个维度,你还在第一层吗?——人大提出图表创作新方式

从「能用」到「好用」:数据可视化的三个维度,你还在第一层吗?——人大提出图表创作新方式

从「能用」到「好用」:数据可视化的三个维度,你还在第一层吗?——人大提出图表创作新方式

不知道有多少人曾为了让数据图表既“好看”又“好懂”,而在设计软件与代码编辑器之间反复横跳,熬到“头秃”。

来自主题: AI技术研报
8698 点击    2026-01-21 12:00