AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
VL-LN Bench:模拟「边走边问找具体目标」的真实导航场景

VL-LN Bench:模拟「边走边问找具体目标」的真实导航场景

VL-LN Bench:模拟「边走边问找具体目标」的真实导航场景

如果将一台在视觉语言导航(VLN)任务中表现优异的机器人直接搬进家庭场景,往往会遇到不少实际问题。

来自主题: AI技术研报
7742 点击    2026-02-03 08:43
MiniMax M2-her:我们做出了更懂你的 AI

MiniMax M2-her:我们做出了更懂你的 AI

MiniMax M2-her:我们做出了更懂你的 AI

今天,我们分享 MiniMax-M2-her 背后的技术思考。M2-her 也是服务星野/Talkie的底层模型。

来自主题: AI技术研报
7476 点击    2026-02-02 13:25
开源免费!推荐一款基于DeepSeek大模型RAG知识库与知识图谱平台,打通飞书、企业微信、钉钉

开源免费!推荐一款基于DeepSeek大模型RAG知识库与知识图谱平台,打通飞书、企业微信、钉钉

开源免费!推荐一款基于DeepSeek大模型RAG知识库与知识图谱平台,打通飞书、企业微信、钉钉

语析Yuxi-Know 是基于大模型RAG知识库与知识图谱技术构建的智能问答平台,支持多种知识库文件格式,如PDF、TXT、MD、Docx,支持将文件内容转换为向量存储,便于快速检索。

来自主题: AI技术研报
5528 点击    2026-02-02 13:23
挑战用阿里版Claude Cowork跑通Clawdbot5个神级玩法,我Mac Mini可能白买了

挑战用阿里版Claude Cowork跑通Clawdbot5个神级玩法,我Mac Mini可能白买了

挑战用阿里版Claude Cowork跑通Clawdbot5个神级玩法,我Mac Mini可能白买了

起因是这样的, 当我还在跟Mac Mini版满血版Clawdbot PK的时候,发现有人统计了排名前十的Clawdbot常见任务,分别是邮件处理,日历管理(日程提醒和会议安排),控制Claude Code开发,每日简报等,

来自主题: AI技术研报
7169 点击    2026-02-02 13:23
Nature | 清北合作研发全球首个全柔性存算一体AI芯片

Nature | 清北合作研发全球首个全柔性存算一体AI芯片

Nature | 清北合作研发全球首个全柔性存算一体AI芯片

一张薄如纸片、能卷在手指上的柔性芯片(不是柔性印刷电路板,是柔性集成电路),能做什么?

来自主题: AI技术研报
8104 点击    2026-02-02 10:05
Vibe Researching必备的科研MCP和Skills,实现10倍学术产出

Vibe Researching必备的科研MCP和Skills,实现10倍学术产出

Vibe Researching必备的科研MCP和Skills,实现10倍学术产出

大家好,我是鲁工。 Vibe Coding概念火了之后,顺带在很多领域兴起了Vibe的潮流。比如Vibe PPT、Vibe Video,以及我今天要聊的Vibe Researching。

来自主题: AI技术研报
8517 点击    2026-02-02 10:03
穿帮,抽动,DeepMind这篇论文瞄准了AI视频最后的破绽|Hao好聊论文

穿帮,抽动,DeepMind这篇论文瞄准了AI视频最后的破绽|Hao好聊论文

穿帮,抽动,DeepMind这篇论文瞄准了AI视频最后的破绽|Hao好聊论文

去年下半年,模型界最大的惊喜莫过于Sora 2和Veo 3,他们已经把视频生成推到了新高度:光影完美,纹理细腻,甚至有着很高的时空一致性。

来自主题: AI技术研报
6453 点击    2026-02-02 09:34
o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 —— SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

来自主题: AI技术研报
6508 点击    2026-02-02 09:31
抛弃向量推荐!蚂蚁用8B小模型构建「用户“话”像」,实现跨任务跨模型通用并拿下SOTA

抛弃向量推荐!蚂蚁用8B小模型构建「用户“话”像」,实现跨任务跨模型通用并拿下SOTA

抛弃向量推荐!蚂蚁用8B小模型构建「用户“话”像」,实现跨任务跨模型通用并拿下SOTA

怎样做一个爆款大模型应用?这恐怕是2026年AI开发者们都在关注的问题。当算力和性能不再是唯一的护城河,“爆款”意味着大模型要能精准地“抓住”每一名具体的用户,而个性化正是其中的关键技术之一。

来自主题: AI技术研报
5965 点击    2026-02-01 13:10
5秒出4张2K大图!阿里提出2步生成方案,拉爆AI生图进度条

5秒出4张2K大图!阿里提出2步生成方案,拉爆AI生图进度条

5秒出4张2K大图!阿里提出2步生成方案,拉爆AI生图进度条

AI生成一张图片,你愿意等多久?在主流扩散模型还在迭代中反复“磨叽”、让用户盯着进度条发呆时,阿里智能引擎团队直接把进度条“拉爆”了——5秒钟,到手4张2K级高清大图。

来自主题: AI技术研报
9194 点击    2026-01-31 14:12
VLM剪枝新SOTA:无需重训练,注意力去偏置超越6大主流方案

VLM剪枝新SOTA:无需重训练,注意力去偏置超越6大主流方案

VLM剪枝新SOTA:无需重训练,注意力去偏置超越6大主流方案

近年来,Vision-Language Models(视觉—语言模型)在多模态理解任务中取得了显著进展,并逐渐成为通用人工智能的重要技术路线。

来自主题: AI技术研报
5963 点击    2026-01-31 12:30
LLM-in-Sandbox:给大模型一台电脑,激发通用智能体能力

LLM-in-Sandbox:给大模型一台电脑,激发通用智能体能力

LLM-in-Sandbox:给大模型一台电脑,激发通用智能体能力

大模型的能力正在被不同的范式逐步解锁:In-Context Learning 展示了模型无需微调即可泛化到新任务;Chain-of-Thought 通过引导模型分步推理来提升复杂问题的求解能力;近期,智能体框架则赋予模型调用工具、多轮交互的能力。

来自主题: AI技术研报
9759 点击    2026-01-30 16:05
刚刚,创智+模思发布开源版Sora2,电影级音视频同步生成,打破闭源技术垄断

刚刚,创智+模思发布开源版Sora2,电影级音视频同步生成,打破闭源技术垄断

刚刚,创智+模思发布开源版Sora2,电影级音视频同步生成,打破闭源技术垄断

今天上午,上海创智学院 OpenMOSS 团队联合初创公司模思智能(MOSI),正式发布了端到端音视频生成模型 —— MOVA(MOSS-Video-and-Audio)。

来自主题: AI技术研报
8021 点击    2026-01-30 10:39
当每个人都能指挥一支 AI 大军,什么能力最重要?

当每个人都能指挥一支 AI 大军,什么能力最重要?

当每个人都能指挥一支 AI 大军,什么能力最重要?

我有个观察:善用 Coding Agent 的人有个共同点——他们擅长定义问题、拆解问题、验收结果。这类人通常有技术管理经验。

来自主题: AI技术研报
8680 点击    2026-01-30 09:58
大模型学会拖进度条看视频了!阿里新研究让视频推理告别脑补,实现证据链思考 | ICLR 2026

大模型学会拖进度条看视频了!阿里新研究让视频推理告别脑补,实现证据链思考 | ICLR 2026

大模型学会拖进度条看视频了!阿里新研究让视频推理告别脑补,实现证据链思考 | ICLR 2026

为什么让多模态大模型“一步一步思考”(”Let’s think step by step”)来回答视频问题,效果有时甚至还不如让它“直接回答”?

来自主题: AI技术研报
8688 点击    2026-01-30 09:56
我的Clawdbot和你的一样,只不过你多花了4000元

我的Clawdbot和你的一样,只不过你多花了4000元

我的Clawdbot和你的一样,只不过你多花了4000元

哈喽,大家好,我是刘小排。 最近我见到人就推荐Clawdbot。

来自主题: AI技术研报
6926 点击    2026-01-29 16:53
给Clawdbot接入上万专业数据,放进飞书后,实现 7*24 小时股票分析

给Clawdbot接入上万专业数据,放进飞书后,实现 7*24 小时股票分析

给Clawdbot接入上万专业数据,放进飞书后,实现 7*24 小时股票分析

最近Clawdbot(现:Moltbot)全网爆火。它能接管你的社交媒体,能发帖、能监听、能回复、能长期驻场。不是一次性回答,而是持续存在。

来自主题: AI技术研报
10119 点击    2026-01-29 15:02
JustGRPO:扩散语言模型的极简主义回归

JustGRPO:扩散语言模型的极简主义回归

JustGRPO:扩散语言模型的极简主义回归

扩散语言模型(Diffusion LLMs, dLLMs)因支持「任意顺序生成」和并行解码而备受瞩目。直觉上,打破传统自回归(AR)「从左到右」的束缚,理应赋予模型更广阔的解空间,从而在数学、代码等复杂任务上解锁更强的推理潜力。

来自主题: AI技术研报
9904 点击    2026-01-29 14:55
AI记忆革命爆发!Clawdbot如何像大脑般记住一切

AI记忆革命爆发!Clawdbot如何像大脑般记住一切

AI记忆革命爆发!Clawdbot如何像大脑般记住一切

一个开源AI,能记住你几个月前的决定、在本地替你跑活、还不受大厂控制:Clawdbot到底是个人助理,还是下一代「赛博打工人」?

来自主题: AI技术研报
9338 点击    2026-01-29 10:11
斯坦福实测GPT-5与Claude 4.5“双盲实验。AI编程,没有协作类产品的原因找到了

斯坦福实测GPT-5与Claude 4.5“双盲实验。AI编程,没有协作类产品的原因找到了

斯坦福实测GPT-5与Claude 4.5“双盲实验。AI编程,没有协作类产品的原因找到了

为什么在LLM推理能力大幅跃升的2026,我们依然只有AI Copilot而没有AI Teammate?尽管AI编程工具遍地开花,但不管是Claude Code还是Codex,本质上仍是“单Agent开发”或“主从控制”架构。而“AI结对编程”迟迟无法落地?

来自主题: AI技术研报
7464 点击    2026-01-29 10:10
字节跳动李航博士新作:AI智能体的通用框架

字节跳动李航博士新作:AI智能体的通用框架

字节跳动李航博士新作:AI智能体的通用框架

AI 智能体是人工智能领域的重要研究方向之一。近期,字节跳动的李航博士在我国计算机科学领域顶级期刊 Journal of Computer Science and Technology(JCST)上发表了一篇题为《General Framework of AI Agents》的观点论文(将收录于 JCST 创刊 40 周年专辑),提出了一个涵盖软件智能体和硬件智能体的通用框架。

来自主题: AI技术研报
7776 点击    2026-01-29 10:07
保姆级Clawdbot教程来了,但我还是想劝大家悠着点。

保姆级Clawdbot教程来了,但我还是想劝大家悠着点。

保姆级Clawdbot教程来了,但我还是想劝大家悠着点。

这几天,相信大家肯定都被一个产品名给刷屏了。

来自主题: AI技术研报
10486 点击    2026-01-28 15:29
AAAI 2026 Oral | SplatSSC:解耦深度引导的高斯泼溅,开启单目语义场景补全高效新范式

AAAI 2026 Oral | SplatSSC:解耦深度引导的高斯泼溅,开启单目语义场景补全高效新范式

AAAI 2026 Oral | SplatSSC:解耦深度引导的高斯泼溅,开启单目语义场景补全高效新范式

单目 3D 语义场景补全 (Semantic Scene Completion, SSC) 是具身智能与自动驾驶领域的一项核心技术,其目标是仅通过单幅图像预测出场景的密集几何结构与语义标签。

来自主题: AI技术研报
8948 点击    2026-01-28 14:58
比人类专家快2倍,斯坦福联合英伟达发布TTT-Discover:用「测试时强化学习」攻克科学难题

比人类专家快2倍,斯坦福联合英伟达发布TTT-Discover:用「测试时强化学习」攻克科学难题

比人类专家快2倍,斯坦福联合英伟达发布TTT-Discover:用「测试时强化学习」攻克科学难题

在技术如火如荼发展的当下,业界常常在思考一个问题:如何利用 AI 发现科学问题的新最优解?

来自主题: AI技术研报
9877 点击    2026-01-28 14:55
曾在一线手搓材料,如今他要为每家企业配一位AI CTO | 专访律动造物谢童

曾在一线手搓材料,如今他要为每家企业配一位AI CTO | 专访律动造物谢童

曾在一线手搓材料,如今他要为每家企业配一位AI CTO | 专访律动造物谢童

在 AI 浪潮席卷全球的今天,大模型在写诗、作画、敲代码上已经展现出惊人的天赋。然而,在面对严谨、硬核的物质科学(物理、化学、材料)时,却常常表现得像个“偏科生”:它们能侃侃而谈化学理论,却在最基础的分子式、晶体结构书写和反应推理上频繁出现不稳定输出:说的像那么回事,写出来却漏洞百出。

来自主题: AI技术研报
6059 点击    2026-01-28 14:54