AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
QwenLong-L1.5发布:一套配方,三大法宝,让30B MoE模型长文本推理能力媲美GPT-5

QwenLong-L1.5发布:一套配方,三大法宝,让30B MoE模型长文本推理能力媲美GPT-5

QwenLong-L1.5发布:一套配方,三大法宝,让30B MoE模型长文本推理能力媲美GPT-5

作为大模型从业者或研究员的你,是否也曾为一个模型的 “长文本能力” 而兴奋,却在实际应用中发现它并没有想象中那么智能?

来自主题: AI技术研报
7525 点击    2025-12-29 14:35
AAAI 2026 Oral|LENS:基于统一强化推理的分割大模型

AAAI 2026 Oral|LENS:基于统一强化推理的分割大模型

AAAI 2026 Oral|LENS:基于统一强化推理的分割大模型

文本提示图像分割(Text-prompted image segmentation)是实现精细化视觉理解的关键技术,在人机交互、具身智能及机器人等前沿领域具有重大的战略意义。这项技术使机器能够根据自然语言指令,在复杂的视觉场景中定位并分割出任意目标。

来自主题: AI技术研报
9028 点击    2025-12-29 14:06
今年TRAE写的代码:100000000000行!超50%程序员每天在按Tab键

今年TRAE写的代码:100000000000行!超50%程序员每天在按Tab键

今年TRAE写的代码:100000000000行!超50%程序员每天在按Tab键

TRAE在一年里写了1000亿行代码!如果按照一个程序员每天写100行有效代码计算,这相当于300万个程序员不吃不喝、没日没夜干了一整年。而这也仅仅是《TRAE 2025年度产品报告》中的冰山一角,更多惊人的数据还包括:

来自主题: AI技术研报
7198 点击    2025-12-29 13:38
开源模型质变:Claude Code 超级小白入门指南

开源模型质变:Claude Code 超级小白入门指南

开源模型质变:Claude Code 超级小白入门指南

两个月以来,我一直想写一篇给小白的 CC 入门指南,今天终于可以写了。

来自主题: AI技术研报
7377 点击    2025-12-29 10:06
不会用命令行?Claude Code图形化界面完全指南

不会用命令行?Claude Code图形化界面完全指南

不会用命令行?Claude Code图形化界面完全指南

面对苍白的CLI终端界面,有些深度依赖IDE的使用者,用Claude Code还是会不习惯的。于是我找了蛮多的资料,看看有没有适合新手的GUI工具。

来自主题: AI技术研报
6701 点击    2025-12-29 10:05
告别「单线程」思维:通研院提出NPR框架,让智能体进化出原生的并行推理大脑

告别「单线程」思维:通研院提出NPR框架,让智能体进化出原生的并行推理大脑

告别「单线程」思维:通研院提出NPR框架,让智能体进化出原生的并行推理大脑

近年来,大语言模型在「写得长、写得顺」这件事上进步飞快。但当任务升级到真正复杂的推理场景 —— 需要兵分多路探索、需要自我反思与相互印证、需要在多条线索之间做汇总与取舍时,传统的链式思维(Chain-of-Thought)往往就开始「吃力」:容易被早期判断带偏、发散不足、自我纠错弱,而且顺序生成的效率天然受限。

来自主题: AI技术研报
10038 点击    2025-12-29 09:36
顶刊TPAMI|多模态视频理解领域重磅数据更新:MeViSv2发布

顶刊TPAMI|多模态视频理解领域重磅数据更新:MeViSv2发布

顶刊TPAMI|多模态视频理解领域重磅数据更新:MeViSv2发布

近日,多模态视频理解领域迎来重磅更新!由复旦大学、上海财经大学、南洋理工大学联合打造的 MeViSv2 数据集正式发布,并已被顶刊 IEEE TPAMI 录用。

来自主题: AI技术研报
9347 点击    2025-12-29 09:07
华人一作!Meta等复刻AlphaZero神话,AI甩开人类自修成神

华人一作!Meta等复刻AlphaZero神话,AI甩开人类自修成神

华人一作!Meta等复刻AlphaZero神话,AI甩开人类自修成神

当模型学会「左右互搏」的那一刻,平庸的模仿时代结束了,真正的硅基编程奇迹刚刚开始。

来自主题: AI技术研报
9564 点击    2025-12-29 09:06
AI 真能看懂物理世界吗?FysicsWorld:填补全模态交互与物理感知评测的空白

AI 真能看懂物理世界吗?FysicsWorld:填补全模态交互与物理感知评测的空白

AI 真能看懂物理世界吗?FysicsWorld:填补全模态交互与物理感知评测的空白

近年来,多模态大语言模型正在经历一场快速的范式转变,新兴研究聚焦于构建能够联合处理和生成跨语言、视觉、音频以及其他潜在感官模态信息的统一全模态大模型。此类模型的目标不仅是感知全模态内容,还要将视觉理解和生成整合到统一架构中,从而实现模态间的协同交互。

来自主题: AI技术研报
8635 点击    2025-12-29 09:05
百万人围观,「上下文图谱」火了,万亿美元新机遇?

百万人围观,「上下文图谱」火了,万亿美元新机遇?

百万人围观,「上下文图谱」火了,万亿美元新机遇?

编辑|张倩、陈陈 当智能体(Agent)开始深度介入人类世界,关于豆包 AI 手机的讨论可能只是个开始。 在此之前,手机、电脑软件都是给人用的 —— 人负责一步步操作,系统负责把信息存好、算好。但现在

来自主题: AI技术研报
8516 点击    2025-12-28 20:33
只剩1%的人在完全手写代码,近七成Vibe产品仅需一个月就可上线 | 2025中国Vibe创作生态报告发布

只剩1%的人在完全手写代码,近七成Vibe产品仅需一个月就可上线 | 2025中国Vibe创作生态报告发布

只剩1%的人在完全手写代码,近七成Vibe产品仅需一个月就可上线 | 2025中国Vibe创作生态报告发布

开发周期被打破了。曾需数月打磨的 MVP,如今近七成可在一个月内上线;曾需十人协作的产研流程,如今超七成由三人以下小团队完成。AI Coding 工具已不再是辅助,而是主力:仅 1% 的创作者仍完全手写代码,近六成将多数乃至全部编码交予 AI。效率的跃升前所未有,但随之而来的是一个尖锐的问题:快,是否等于有价值?

来自主题: AI技术研报
8468 点击    2025-12-27 10:54
训练时间爆砍80%!港大快手联合打造了一个AI炼金师:专挑“有营养”数据,20%数据达成50%效果

训练时间爆砍80%!港大快手联合打造了一个AI炼金师:专挑“有营养”数据,20%数据达成50%效果

训练时间爆砍80%!港大快手联合打造了一个AI炼金师:专挑“有营养”数据,20%数据达成50%效果

由香港大学丁凯欣领导,联合华南理工大学周洋以及快手科技Kling团队共同完成的这项研究,开发出了一个名为“炼金师”(Alchemist)的AI系统。它就像一位挑剔的大厨,能从海量图片数据中精准挑选出最有价值的一半。

来自主题: AI技术研报
7380 点击    2025-12-27 10:30
上下文工程的Agent Skills来了,CC、Codex直接用,一周获2.3k star

上下文工程的Agent Skills来了,CC、Codex直接用,一周获2.3k star

上下文工程的Agent Skills来了,CC、Codex直接用,一周获2.3k star

GitHub上最近出现了一个非常火的项目Agent-Skills-for-Context-Engineering,发布不到一周就斩获了2.3k Stars。为什么它能瞬间引爆社区?因为站在2025年末的节点上,我们已经受够了那些只存在于大厂白皮书里的Context Engineering(上下文工程) 理论。

来自主题: AI技术研报
7599 点击    2025-12-26 10:56
物理学变天!「AI主导」论文首次登顶刊,人类科学家沦为验证者?

物理学变天!「AI主导」论文首次登顶刊,人类科学家沦为验证者?

物理学变天!「AI主导」论文首次登顶刊,人类科学家沦为验证者?

AI提供1%的灵感,人类提供99%汗水!密歇根州立大学物理学家许道辉,在AI启发下,重新思考量子力学本质,在顶刊《物理快报B》上发表了相关结论。

来自主题: AI技术研报
7336 点击    2025-12-26 10:12
一键生成出海营销数字人!GLM-4.7+Claude Code可以封神了~

一键生成出海营销数字人!GLM-4.7+Claude Code可以封神了~

一键生成出海营销数字人!GLM-4.7+Claude Code可以封神了~

大家好,我是被智谱卷到的袋鼠帝。 昨天智谱刚把GLM-4.7放出来,群里就有老哥找我写文章了..

来自主题: AI技术研报
6248 点击    2025-12-26 10:11
客观聊聊 MiniMax 的新模型

客观聊聊 MiniMax 的新模型

客观聊聊 MiniMax 的新模型

前脚刚听完罗永浩和 MiniMax 创始人闫俊杰的超长播客,然后就看到 MiniMax M2.1 发布了。

来自主题: AI技术研报
9193 点击    2025-12-26 10:07
《全载录丨Xsignal 全球AI应用行业年度报告丨2025》丨Xsignal深度文章

《全载录丨Xsignal 全球AI应用行业年度报告丨2025》丨Xsignal深度文章

《全载录丨Xsignal 全球AI应用行业年度报告丨2025》丨Xsignal深度文章

在生成式AI(GenAI)的推动下,2025年标志着行业从“震撼期”正式步入“深水区”。这并非资本的泡沫,而是计算范式从CPU向GPU的根本性迁移——数据中心正进化为实时生产智能的“AI工厂”。相比于模型参数的单纯竞赛,AI应用带来的“任务执行”能力与直观体验,让人切身感受到从“信息检索”向“智能生成”的范式跃迁。

来自主题: AI技术研报
8019 点击    2025-12-26 09:43
向量检索爆雷!傅聪联合浙大发布IceBerg Benchmark:HNSW并非最优,评估体系存在严重偏差

向量检索爆雷!傅聪联合浙大发布IceBerg Benchmark:HNSW并非最优,评估体系存在严重偏差

向量检索爆雷!傅聪联合浙大发布IceBerg Benchmark:HNSW并非最优,评估体系存在严重偏差

将多模态数据纳入到RAG,甚至Agent框架,是目前LLM应用领域最火热的主题之一,针对多模态数据最自然的召回方式,便是向量检索。

来自主题: AI技术研报
6510 点击    2025-12-26 09:40
超越谷歌,全球第一!上交AI科学家王者归来,登顶OpenAI MLE-bench

超越谷歌,全球第一!上交AI科学家王者归来,登顶OpenAI MLE-bench

超越谷歌,全球第一!上交AI科学家王者归来,登顶OpenAI MLE-bench

刚刚,由SciMaster团队推出的AI机器学习专家ML-Master 2.0,基于国产开源大模型DeepSeek,在OpenAI权威基准测试MLE-bench中一举击败Google、Meta、微软等国际顶流,刷新全球SOTA,再次登顶!目前该功能已在SciMaster线上平台开放waiting list,欢迎申请体验。

来自主题: AI技术研报
6366 点击    2025-12-25 14:22
游戏AI来了!英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达

游戏AI来了!英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达

游戏AI来了!英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达

英伟达让AI仅靠「看直播」就学会了通用游戏操作。虚拟世界已成为物理智能的黑客帝国,看4万小时直播学会几乎所有游戏!

来自主题: AI技术研报
6463 点击    2025-12-25 14:17
Anthropic公布新技术:不靠删数据,参数隔离移除AI危险

Anthropic公布新技术:不靠删数据,参数隔离移除AI危险

Anthropic公布新技术:不靠删数据,参数隔离移除AI危险

近年来,大语言模型的能力突飞猛进,但随之而来的却是愈发棘手的双重用途风险(dual-use risks)。当模型在海量公开互联网数据中学习时,它不仅掌握语言与推理能力,也不可避免地接触到 CBRN(化学、生物、放射、核)危险制造、软件漏洞利用等高敏感度、潜在危险的知识领域。

来自主题: AI技术研报
8438 点击    2025-12-25 10:21
硅谷青睐的中国模型更新了!一觉醒来,直接套壳

硅谷青睐的中国模型更新了!一觉醒来,直接套壳

硅谷青睐的中国模型更新了!一觉醒来,直接套壳

智谱作为「大模型第一股」赴港上市前夕,直接掏出了旗舰模型GLM-4.7并开源!

来自主题: AI技术研报
5890 点击    2025-12-25 10:21