AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
上下文工程的Agent Skills来了,CC、Codex直接用,一周获2.3k star

上下文工程的Agent Skills来了,CC、Codex直接用,一周获2.3k star

上下文工程的Agent Skills来了,CC、Codex直接用,一周获2.3k star

GitHub上最近出现了一个非常火的项目Agent-Skills-for-Context-Engineering,发布不到一周就斩获了2.3k Stars。为什么它能瞬间引爆社区?因为站在2025年末的节点上,我们已经受够了那些只存在于大厂白皮书里的Context Engineering(上下文工程) 理论。

来自主题: AI技术研报
7185 点击    2025-12-26 10:56
物理学变天!「AI主导」论文首次登顶刊,人类科学家沦为验证者?

物理学变天!「AI主导」论文首次登顶刊,人类科学家沦为验证者?

物理学变天!「AI主导」论文首次登顶刊,人类科学家沦为验证者?

AI提供1%的灵感,人类提供99%汗水!密歇根州立大学物理学家许道辉,在AI启发下,重新思考量子力学本质,在顶刊《物理快报B》上发表了相关结论。

来自主题: AI技术研报
7184 点击    2025-12-26 10:12
一键生成出海营销数字人!GLM-4.7+Claude Code可以封神了~

一键生成出海营销数字人!GLM-4.7+Claude Code可以封神了~

一键生成出海营销数字人!GLM-4.7+Claude Code可以封神了~

大家好,我是被智谱卷到的袋鼠帝。 昨天智谱刚把GLM-4.7放出来,群里就有老哥找我写文章了..

来自主题: AI技术研报
5955 点击    2025-12-26 10:11
客观聊聊 MiniMax 的新模型

客观聊聊 MiniMax 的新模型

客观聊聊 MiniMax 的新模型

前脚刚听完罗永浩和 MiniMax 创始人闫俊杰的超长播客,然后就看到 MiniMax M2.1 发布了。

来自主题: AI技术研报
8974 点击    2025-12-26 10:07
向量检索爆雷!傅聪联合浙大发布IceBerg Benchmark:HNSW并非最优,评估体系存在严重偏差

向量检索爆雷!傅聪联合浙大发布IceBerg Benchmark:HNSW并非最优,评估体系存在严重偏差

向量检索爆雷!傅聪联合浙大发布IceBerg Benchmark:HNSW并非最优,评估体系存在严重偏差

将多模态数据纳入到RAG,甚至Agent框架,是目前LLM应用领域最火热的主题之一,针对多模态数据最自然的召回方式,便是向量检索。

来自主题: AI技术研报
6288 点击    2025-12-26 09:40
超越谷歌,全球第一!上交AI科学家王者归来,登顶OpenAI MLE-bench

超越谷歌,全球第一!上交AI科学家王者归来,登顶OpenAI MLE-bench

超越谷歌,全球第一!上交AI科学家王者归来,登顶OpenAI MLE-bench

刚刚,由SciMaster团队推出的AI机器学习专家ML-Master 2.0,基于国产开源大模型DeepSeek,在OpenAI权威基准测试MLE-bench中一举击败Google、Meta、微软等国际顶流,刷新全球SOTA,再次登顶!目前该功能已在SciMaster线上平台开放waiting list,欢迎申请体验。

来自主题: AI技术研报
6223 点击    2025-12-25 14:22
游戏AI来了!英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达

游戏AI来了!英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达

游戏AI来了!英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达

英伟达让AI仅靠「看直播」就学会了通用游戏操作。虚拟世界已成为物理智能的黑客帝国,看4万小时直播学会几乎所有游戏!

来自主题: AI技术研报
6297 点击    2025-12-25 14:17
Anthropic公布新技术:不靠删数据,参数隔离移除AI危险

Anthropic公布新技术:不靠删数据,参数隔离移除AI危险

Anthropic公布新技术:不靠删数据,参数隔离移除AI危险

近年来,大语言模型的能力突飞猛进,但随之而来的却是愈发棘手的双重用途风险(dual-use risks)。当模型在海量公开互联网数据中学习时,它不仅掌握语言与推理能力,也不可避免地接触到 CBRN(化学、生物、放射、核)危险制造、软件漏洞利用等高敏感度、潜在危险的知识领域。

来自主题: AI技术研报
8327 点击    2025-12-25 10:21
硅谷青睐的中国模型更新了!一觉醒来,直接套壳

硅谷青睐的中国模型更新了!一觉醒来,直接套壳

硅谷青睐的中国模型更新了!一觉醒来,直接套壳

智谱作为「大模型第一股」赴港上市前夕,直接掏出了旗舰模型GLM-4.7并开源!

来自主题: AI技术研报
5742 点击    2025-12-25 10:21
生成不遗忘,「超长时序」世界模型!北大EgoLCD长短时记忆加持

生成不遗忘,「超长时序」世界模型!北大EgoLCD长短时记忆加持

生成不遗忘,「超长时序」世界模型!北大EgoLCD长短时记忆加持

视频生成模型总是「记性不好」?生成几秒钟后物体就变形、背景就穿帮?北大、中大等机构联合发布EgoLCD,借鉴人类「长短时记忆」机制,首创稀疏KV缓存+LoRA动态适应架构,彻底解决长视频「内容漂移」难题,在EgoVid-5M基准上刷新SOTA!让AI像人一样拥有连贯的第一人称视角记忆。

来自主题: AI技术研报
7254 点击    2025-12-25 10:16
北航提出代码大模型的 Scaling Laws:编程语言差异与多语言最优配比策略

北航提出代码大模型的 Scaling Laws:编程语言差异与多语言最优配比策略

北航提出代码大模型的 Scaling Laws:编程语言差异与多语言最优配比策略

在代码大模型(Code LLMs)的预训练中,行业内长期存在一种惯性思维,即把所有编程语言的代码都视为同质化的文本数据,主要关注数据总量的堆叠。然而,现代软件开发本质上是多语言混合的,不同语言的语法特性、语料规模和应用场景差异巨大。

来自主题: AI技术研报
6539 点击    2025-12-25 09:46
最鲁棒的MLLM!港科大开源「退化感知推理新范式」 | AAAI'26

最鲁棒的MLLM!港科大开源「退化感知推理新范式」 | AAAI'26

最鲁棒的MLLM!港科大开源「退化感知推理新范式」 | AAAI'26

多模态大语言模型(MLLMs)已成为AI视觉理解的核心引擎,但其在真实世界视觉退化(模糊、噪声、遮挡等)下的性能崩溃,始终是制约产业落地的致命瓶颈。

来自主题: AI技术研报
7967 点击    2025-12-25 09:44
从「会表演」到「更会演」:KlingAvatar2.0让数字人拥有生动灵魂

从「会表演」到「更会演」:KlingAvatar2.0让数字人拥有生动灵魂

从「会表演」到「更会演」:KlingAvatar2.0让数字人拥有生动灵魂

还记得几个月前那个能随着音乐节拍自然舞动的 KlingAvatar 数字人吗?现在,它迎来了史诗级进化!

来自主题: AI技术研报
8481 点击    2025-12-24 15:32
GLM-4.7发布后,n8n就不用学了!搭个AI Skills一键生成工作流

GLM-4.7发布后,n8n就不用学了!搭个AI Skills一键生成工作流

GLM-4.7发布后,n8n就不用学了!搭个AI Skills一键生成工作流

今天,我又要来得罪人了。 甚至可以说,这篇文章发出来,可能会直接断了很多人的财路。

来自主题: AI技术研报
9386 点击    2025-12-24 10:42
拿走200多万奖金的AI人才,到底给出了什么样的技术方案?

拿走200多万奖金的AI人才,到底给出了什么样的技术方案?

拿走200多万奖金的AI人才,到底给出了什么样的技术方案?

在国内,懂技术 —— 尤其是 AI 技术的年轻人,真的不缺崭露头角的机会。

来自主题: AI技术研报
6425 点击    2025-12-24 10:09
清华系DeepSeek时刻来了,硅谷沸腾!单卡200倍加速,视频进入秒级时代

清华系DeepSeek时刻来了,硅谷沸腾!单卡200倍加速,视频进入秒级时代

清华系DeepSeek时刻来了,硅谷沸腾!单卡200倍加速,视频进入秒级时代

视频生成领域的「DeepSeek时刻」来了!清华开源TurboDiffusion,将AI视频生成从「分钟级」硬生生拉进「秒级」实时时代,单卡200倍加速让普通显卡也能跑出大片!

来自主题: AI技术研报
7926 点击    2025-12-24 10:08
谷歌黑魔法,没人能看懂的Gemini 3 Flash

谷歌黑魔法,没人能看懂的Gemini 3 Flash

谷歌黑魔法,没人能看懂的Gemini 3 Flash

参数越小,智商越高?Gemini 3 Flash用百万级长上下文、白菜价成本,把自家大哥Pro按在地上摩擦。谷歌到底掏出了什么黑魔法,让整个大模型圈开始怀疑人生?

来自主题: AI技术研报
8112 点击    2025-12-23 15:22
VideoCoF:将「时序推理」引入视频编辑,无Mask实现高精度编辑与长视频外推!

VideoCoF:将「时序推理」引入视频编辑,无Mask实现高精度编辑与长视频外推!

VideoCoF:将「时序推理」引入视频编辑,无Mask实现高精度编辑与长视频外推!

现有的视频编辑模型往往面临「鱼与熊掌不可兼得」的困境:专家模型精度高但依赖 Mask,通用模型虽免 Mask 但定位不准。来自悉尼科技大学和浙江大学的研究团队提出了一种全新的视频编辑框架 VideoCoF,受 LLM「思维链」启发,通过「看 - 推理 - 编辑」的流程,仅需 50k 训练数据,就在多项任务上取得了 SOTA 效果,并完美支持长视频外推!

来自主题: AI技术研报
7637 点击    2025-12-23 14:53
AI一旦开始「内卷」,会变成什么样?腾讯混元和上交联合揭秘多智能体「饥饿游戏」

AI一旦开始「内卷」,会变成什么样?腾讯混元和上交联合揭秘多智能体「饥饿游戏」

AI一旦开始「内卷」,会变成什么样?腾讯混元和上交联合揭秘多智能体「饥饿游戏」

在多智能体系统的想象中,我们常常看到这样一幅图景: 多个 AI 智能体分工协作、彼此配合,像一个高效团队一样攻克复杂任务,展现出超越单体智能的 “集体智慧”。

来自主题: AI技术研报
9688 点击    2025-12-23 14:33
为什么Agent总是Demo猛如龙实战一条虫?

为什么Agent总是Demo猛如龙实战一条虫?

为什么Agent总是Demo猛如龙实战一条虫?

为什么Agent在演示时无所不能,到了实际场景却频频拉胯?

来自主题: AI技术研报
8815 点击    2025-12-23 14:32