AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
全球首次,Transformer「混血」速度狂飙65倍!英伟达已下注

全球首次,Transformer「混血」速度狂飙65倍!英伟达已下注

全球首次,Transformer「混血」速度狂飙65倍!英伟达已下注

扩散建模+自回归,打通文本生成任督二脉!这一次,来自康奈尔、CMU等机构的研究者,提出了前所未有的「混合体」——Eso-LM。有人惊呼:「自回归危险了。」

来自主题: AI技术研报
5727 点击    2025-06-14 15:07
AGI真方向?谷歌证明:智能体在自研世界模型,世界模型is all You Need

AGI真方向?谷歌证明:智能体在自研世界模型,世界模型is all You Need

AGI真方向?谷歌证明:智能体在自研世界模型,世界模型is all You Need

越通用,就越World Models。 我们知道,大模型技术爆发的原点可能在谷歌一篇名为《Attention is All You Need》的论文上。

来自主题: AI技术研报
6517 点击    2025-06-14 13:22
AI自己给自己当网管,实现安全“顿悟时刻”,风险率直降9.6%

AI自己给自己当网管,实现安全“顿悟时刻”,风险率直降9.6%

AI自己给自己当网管,实现安全“顿悟时刻”,风险率直降9.6%

大型推理模型(LRMs)在解决复杂任务时展现出的强大能力令人惊叹,但其背后隐藏的安全风险不容忽视。

来自主题: AI技术研报
7117 点击    2025-06-14 12:35
DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版

DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版

DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版

仅用不到1200行代码,实现最小化且完全可读的vLLM!DeepSeek研究员俞星凯搞了个开源项目引得大伙拍手叫绝。项目名为Nano-vLLM(纳米级-vLLM),有三大特点:快速离线推理:推理速度可与vLLM相媲美

来自主题: AI技术研报
7142 点击    2025-06-13 15:41
统一20+多智能体方法,MASLab震撼发布

统一20+多智能体方法,MASLab震撼发布

统一20+多智能体方法,MASLab震撼发布

为了推动该领域加速健康发展,由上海交通大学、上海 AI 实验室、牛津大学、普林斯顿大学、Meta 等十个机构联合推出的 MASLab,带来首个统一、全面、研究友好的大模型多智能体系统代码库:

来自主题: AI技术研报
7733 点击    2025-06-13 15:31
黄铁军对大模型的四个预判:洗牌、安全核爆、GPT-5与再造DeepSeek

黄铁军对大模型的四个预判:洗牌、安全核爆、GPT-5与再造DeepSeek

黄铁军对大模型的四个预判:洗牌、安全核爆、GPT-5与再造DeepSeek

4月份,李飞飞教授领先编制的《2025年人工智能指数报告》提供的数据显示,2024年全年具有特殊影响力的模型(Notable AI models)当中,排名前5的几乎都来自美国、中国的科技巨头。

来自主题: AI技术研报
6909 点击    2025-06-13 14:14
何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升

扩散模型风头正盛,何恺明最新论文也与此相关。 研究的是如何把扩散模型和表征学习联系起来—— 给扩散模型加上“整理收纳”功能,使其内部特征更加有序,从而生成效果更加自然逼真的图片。

来自主题: AI技术研报
5915 点击    2025-06-13 12:49
CVPR2025视频生成统一评估架构,上交x斯坦福联合提出让MLLM像人类一样打分

CVPR2025视频生成统一评估架构,上交x斯坦福联合提出让MLLM像人类一样打分

CVPR2025视频生成统一评估架构,上交x斯坦福联合提出让MLLM像人类一样打分

视频生成技术正以前所未有的速度革新着当前的视觉内容创作方式,从电影制作到广告设计,从虚拟现实到社交媒体,高质量且符合人类期望的视频生成模型正变得越来越重要。

来自主题: AI技术研报
5399 点击    2025-06-13 11:46
专治不服!Amazon重磅发布!AI的SOP高考来了!顶级Agent能考几分?

专治不服!Amazon重磅发布!AI的SOP高考来了!顶级Agent能考几分?

专治不服!Amazon重磅发布!AI的SOP高考来了!顶级Agent能考几分?

您可能会问,LLM Agent的SOP到底是什么,为什么称它为AI的高考?SOP全称是标准操作程序(Standard Operating Procedures)很多朋友可能很熟悉,但它绝不是简单的步骤清单——它更像是AI能否在工业环境中真正"上岗"的终极考验。

来自主题: AI技术研报
6569 点击    2025-06-13 11:35
四万字·深度求索|泛聊一下强化学习(RL)下的深度推理(DR)对真实世界(RW)建模与泛化的本质

四万字·深度求索|泛聊一下强化学习(RL)下的深度推理(DR)对真实世界(RW)建模与泛化的本质

四万字·深度求索|泛聊一下强化学习(RL)下的深度推理(DR)对真实世界(RW)建模与泛化的本质

强化学习·RL范式尝试为LLMs应用于广泛的Agentic AI甚至构建AGI打开了一扇“深度推理”的大门,而RL是否是唯一且work的一扇门,先按下不表(不作为今天跟大家唠的重点),至少目前看来,随着o1/o3/r1/qwq..等一众语言推理模型的快速发展,正推动着LLMs和Agentic AI在不同领域的价值与作用,

来自主题: AI技术研报
7951 点击    2025-06-13 10:48
当谣言搭上“AI”的东风

当谣言搭上“AI”的东风

当谣言搭上“AI”的东风

标识能否有效应对?

来自主题: AI技术研报
6286 点击    2025-06-13 10:42
AI自动写学术综述:10分钟生成6万字,成本不到四块钱

AI自动写学术综述:10分钟生成6万字,成本不到四块钱

AI自动写学术综述:10分钟生成6万字,成本不到四块钱

学术综述论文在科学研究中发挥着至关重要的作用,特别是在研究文献快速增长的时代。传统的人工驱动综述写作需要研究者审阅大量文章,既耗时又难以跟上最新进展。而现有的自动化综述生成方法面临诸多挑战:

来自主题: AI技术研报
5409 点击    2025-06-13 10:35
DeepMind首个猜想库开源,获陶哲轩力挺!

DeepMind首个猜想库开源,获陶哲轩力挺!

DeepMind首个猜想库开源,获陶哲轩力挺!

谷歌DeepMind重磅出击,开源首个形式化数学猜想库,获陶哲轩力挺!从解析数论的兰道猜想开始,这个开源项目将为AI破解数学难题的未来铺路。

来自主题: AI技术研报
5604 点击    2025-06-12 18:03
256块NPU训成8B视频模型、超越Sora等一众闭源!抖音内容技术团队开源ContentV

256块NPU训成8B视频模型、超越Sora等一众闭源!抖音内容技术团队开源ContentV

256块NPU训成8B视频模型、超越Sora等一众闭源!抖音内容技术团队开源ContentV

近日,抖音内容技术团队开源了 ContentV,一种面向视频生成任务的高效训练方案。该方案在多项技术优化的基础上,使用 256 块 NPU,在约 4 周内完成了一个 8B 参数模型的训练。尽管资源有限,ContentV 在多个评估维度上取得了与现有主流方案相近的生成效果。

来自主题: AI技术研报
7960 点击    2025-06-12 17:56
从 Cursor 到 Claude Code,我发现了 AI 编程的真正价值

从 Cursor 到 Claude Code,我发现了 AI 编程的真正价值

从 Cursor 到 Claude Code,我发现了 AI 编程的真正价值

张小龙说,设计就是分类,我认为写作也是一种分类,有助于定义问题和讨论问题,所以在探讨 AI 编码之前,需要分清出什么时候是在氛围编码(Vibe coding),什么时候是在用 AI 辅助编程。

来自主题: AI技术研报
4535 点击    2025-06-12 17:51
银河通用X清华大学发布业内首款开源人形机器人全身遥操系统OpenWBT,支持多机型、跨虚实,小时内可轻松部署

银河通用X清华大学发布业内首款开源人形机器人全身遥操系统OpenWBT,支持多机型、跨虚实,小时内可轻松部署

银河通用X清华大学发布业内首款开源人形机器人全身遥操系统OpenWBT,支持多机型、跨虚实,小时内可轻松部署

大数据和大模型已成为具身智能领域业界和学术界的焦点,人们也在期待人形机器人真正步入大数据、大模型时代。然而,行业一直缺乏稳定的人形机器人全身遥操作与数据采集方案。

来自主题: AI技术研报
6173 点击    2025-06-12 17:43
2D图像作中介,零训练实现3D场景生成SOTA:英伟达&康奈尔提出文本驱动新流程

2D图像作中介,零训练实现3D场景生成SOTA:英伟达&康奈尔提出文本驱动新流程

2D图像作中介,零训练实现3D场景生成SOTA:英伟达&康奈尔提出文本驱动新流程

想象一下,你是一位游戏设计师,正在为一个奇幻 RPG 游戏搭建场景。你需要创建一个 "精灵族树屋村落"—— 参天古木和树屋、发光的蘑菇路灯、半透明的纱幔帐篷... 传统工作流程中,这可能需要数周时间:先手工建模每个 3D 资产,再逐个调整位置和材质,最后反复测试光照效果…… 总之就是一个字,难。

来自主题: AI技术研报
7386 点击    2025-06-12 17:09
AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题

AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题

AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题

豆包大模型1.6惊艳亮相,成为国内首款多模态SOTA模型,256k对话窗口,深度思考最长上下文。它不仅能看会想,还能动手操作GUI,国内最有潜力考清北。

来自主题: AI技术研报
6157 点击    2025-06-12 17:04
通义实验室最新成果WebDancer:开启自主智能Deep Research的新时代

通义实验室最新成果WebDancer:开启自主智能Deep Research的新时代

通义实验室最新成果WebDancer:开启自主智能Deep Research的新时代

作者介绍: 本文作者来自通义实验室 RAG 团队,致力于面向下一代 RAG 技术进行基础研究。该团队 WebWalker 工作近期也被 ACL 2025 main conference 录用。

来自主题: AI技术研报
6161 点击    2025-06-12 15:24
12个高效让Cursor改bug的技巧,彻底解放AI编程生产力

12个高效让Cursor改bug的技巧,彻底解放AI编程生产力

12个高效让Cursor改bug的技巧,彻底解放AI编程生产力

今天聊个让所有AI Coder都“红温”的话题:用Cursor改Bug,怎么就那么容易翻车?需求描述得清清楚楚,它却越改越乱,好不容易修好一个,又带出仨新的,简直心态爆炸!😭

来自主题: AI技术研报
6358 点击    2025-06-12 15:14