AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
20岁写出Transformer的人,真开源2180亿大模型Command A+

20岁写出Transformer的人,真开源2180亿大模型Command A+

20岁写出Transformer的人,真开源2180亿大模型Command A+

刚刚,Cohere放出2180亿参数的MoE大模型Command A+,单张B200可跑,支持48种语言,还带原生引用能力。但这次发布最炸的,不在参数表上,而在那一个许可证:Apache 2.0。

来自主题: AI资讯
9005 点击    2026-05-22 16:01
首个三模式大语言模型:4倍token吞吐量,长文本秒级时代要来了?

首个三模式大语言模型:4倍token吞吐量,长文本秒级时代要来了?

首个三模式大语言模型:4倍token吞吐量,长文本秒级时代要来了?

英伟达提出了全球首个三模式的大语言模型系列,只需简单更改注意力模式 / 掩码,即可在自回归、扩散和自推测解码之间切换。一个模型,三种解码模式,没有额外的草稿模型,没有架构变更。最快的模式 token 吞吐量能提升 4 倍。

来自主题: AI技术研报
9418 点击    2026-05-22 15:33
李飞飞最新发布ESI-Bench,空间智能的ImageNet来了

李飞飞最新发布ESI-Bench,空间智能的ImageNet来了

李飞飞最新发布ESI-Bench,空间智能的ImageNet来了

李飞飞团队最新发布ESI-Bench——一个专门用来评测具身空间智能的新基准。过去的空间智能评测默认给模型最优观测,而ESI-Bench第一个把观察者变成行动者,闭合了感知-行动回路。

来自主题: AI技术研报
9309 点击    2026-05-22 15:32
700亿!曝DeepSeek融资谈判接近尾声,梁文锋承诺专注开源和AGI

700亿!曝DeepSeek融资谈判接近尾声,梁文锋承诺专注开源和AGI

700亿!曝DeepSeek融资谈判接近尾声,梁文锋承诺专注开源和AGI

,今天,据彭博社报道,DeepSeek正在进行一轮高达约700亿元人民币(约合100亿美元)的融资。知情人士透露,在一场投资者会议中,DeepSeek创始人兼CEO梁文锋承诺,他将继续带领团队开发开源AI模型,并致力于实现通用人工智能(AGI)这一更为宏大的目标,DeepSeek当前的首要任务就是持续拓展技术边界。

来自主题: AI资讯
8872 点击    2026-05-22 13:59
独家|ChatGPT核心贡献者姜旭归国创业:把LLM的Scaling带到具身智能

独家|ChatGPT核心贡献者姜旭归国创业:把LLM的Scaling带到具身智能

独家|ChatGPT核心贡献者姜旭归国创业:把LLM的Scaling带到具身智能

姜旭是少数完整参与过 OpenAI 大模型核心技术演进的华人创业者之一。2019 至 2023 年间,他经历了 GPT 系列能力爆发最关键的阶段,工作横跨底层训练 infra、大规模预训练、RLHF 对齐算法与数据构建等核心链路。

来自主题: AI资讯
10492 点击    2026-05-22 10:26
独家|前 Kimi 后训练负责人宋鸿涌创业,聚焦通用机器人基座模型

独家|前 Kimi 后训练负责人宋鸿涌创业,聚焦通用机器人基座模型

独家|前 Kimi 后训练负责人宋鸿涌创业,聚焦通用机器人基座模型

AI科技评论独家消息,前月之暗面后训练与强化学习负责人宋鸿涌(Flood Sung)已于 2025 年 12 月离职,创立机器人公司「北京十六号机器人科技有限公司」(XVI Robotics),公司业务方向聚焦通用人形机器人基座模型。

来自主题: AI资讯
9397 点击    2026-05-22 10:09
如何用 Codex + Blender,做出全网爆火的 3D 人体模型教科书?

如何用 Codex + Blender,做出全网爆火的 3D 人体模型教科书?

如何用 Codex + Blender,做出全网爆火的 3D 人体模型教科书?

这两天刷 X 的时候,发现一类项目特别火,就是用 Codex + Blender + 3D 生成工具做的交互式 3D 模型网站。

来自主题: AI技术研报
6753 点击    2026-05-22 09:58
大模型狂飙的尽头,这家国产 GPU 厂商要把算力放在客厅

大模型狂飙的尽头,这家国产 GPU 厂商要把算力放在客厅

大模型狂飙的尽头,这家国产 GPU 厂商要把算力放在客厅

一个做国产 GPU 的公司,在前几天的发布会上,一口气更新了好几款端侧产品,有家庭智能中枢、AI PC、Agent,还有具身智能相关的工作。它叫 MTT AICUBE,按官方说法是「一台面向家庭的 AI 智算中枢」。

来自主题: AI资讯
8960 点击    2026-05-22 09:56
教大模型终身学习!中科大连发两篇顶会,突破「知识注入」双重困境

教大模型终身学习!中科大连发两篇顶会,突破「知识注入」双重困境

教大模型终身学习!中科大连发两篇顶会,突破「知识注入」双重困境

中科大团队首先推出动态多模态知识注入基准MMEVOKE,解构遗忘机制,并在此基础上提出全新双阶段框架KORE。通过「知识树」自动增强与「零空间」协方差约束微调,为大模型终身学习开辟了全新路径。

来自主题: AI技术研报
9844 点击    2026-05-22 09:28