AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
模型「漂移」新范式,何恺明新作让生成模型无须迭代推理

模型「漂移」新范式,何恺明新作让生成模型无须迭代推理

模型「漂移」新范式,何恺明新作让生成模型无须迭代推理

训练一个生成模型是很复杂的一件事儿。 从底层逻辑上来看,生成模型是一个逐步拟合的过程。与常见的判别类模型不同,判别类模型通常关注的是将单个样本映射到对应标签,而生成模型则关注从一个分布映射到另一个分布。

来自主题: AI技术研报
9051 点击    2026-02-09 14:24
童年的滚球兽「走进」现实?华为天才少年创业,Xmax AI推出全球首个虚实融合的实时交互视频模型 X1

童年的滚球兽「走进」现实?华为天才少年创业,Xmax AI推出全球首个虚实融合的实时交互视频模型 X1

童年的滚球兽「走进」现实?华为天才少年创业,Xmax AI推出全球首个虚实融合的实时交互视频模型 X1

初创公司 Xmax AI 推出的首个虚实融合的实时交互视频模型 X1,没有复杂的 Prompt,不需要漫长的渲染等待,只需要手势进行交互,就可以让虚拟世界与现实相连,在镜头中令「幻想」成真,让用户体验到实时交互的心流体验。

来自主题: AI资讯
9141 点击    2026-02-09 11:24
速递|从LLM到LTM:Fundamental以“数据基础模型”切入,A轮融资2.55亿美元

速递|从LLM到LTM:Fundamental以“数据基础模型”切入,A轮融资2.55亿美元

速递|从LLM到LTM:Fundamental以“数据基础模型”切入,A轮融资2.55亿美元

大规模表格模型(LTM)而非大规模语言模型(LLM)的 Fundamental 公司 Nexus 模型,在多个重要方面突破了当代人工智能实践。该模型具有确定性——即每次被询问相同问题时都会给出相同答案——且不依赖定义当代大多数人工智能实验室模型的 Transformer 架构 。

来自主题: AI资讯
9654 点击    2026-02-09 11:22
生成式科学智能的新标杆:IntelliFold 2新近发布并开源,主要指标实现全面领先

生成式科学智能的新标杆:IntelliFold 2新近发布并开源,主要指标实现全面领先

生成式科学智能的新标杆:IntelliFold 2新近发布并开源,主要指标实现全面领先

在生物基石模型的全球激烈竞逐中,IntelliGen AI 于本周末正式发布了 IntelliFold 2,这是继 2025 年 7 月 IntelliFold 首版发布后的一次重大升级 [2]。

来自主题: AI资讯
9384 点击    2026-02-09 11:22
登顶Hugging Face论文热榜,LLM重写数据准备的游戏规则

登顶Hugging Face论文热榜,LLM重写数据准备的游戏规则

登顶Hugging Face论文热榜,LLM重写数据准备的游戏规则

来自上海交通大学、清华大学、微软研究院、麻省理工学院(MIT)、上海 AI Lab、小红书、阿里巴巴、港科大(广州)等机构的研究团队,系统梳理了近年来大语言模型在数据准备流程中的角色变化,试图回答一个业界关心的问题:LLM 能否成为下一代数据管道的「智能语义中枢」,彻底重构数据准备的范式?

来自主题: AI技术研报
8372 点击    2026-02-09 11:12
试了试新模型Pony Alpha,感觉似乎不够惊艳?!

试了试新模型Pony Alpha,感觉似乎不够惊艳?!

试了试新模型Pony Alpha,感觉似乎不够惊艳?!

这周真的特别期待,应该可以看到各路厂商神仙打架。这股战火,从周末就开始了。 除了字节发布的Seedance2.0以外,还有个神秘的模型Pony Alpha 也上线到OpenRouter了,已经看到很多网友们纷纷猜测到底是谁家的模型。

来自主题: AI产品测评
8364 点击    2026-02-09 11:12
Waymo联手DeepMind打造世界模型:基于Genie 3,让自动驾驶「脑补」罕见场景

Waymo联手DeepMind打造世界模型:基于Genie 3,让自动驾驶「脑补」罕见场景

Waymo联手DeepMind打造世界模型:基于Genie 3,让自动驾驶「脑补」罕见场景

刚刚,Alphabet 旗下的自动驾驶汽车公司 Waymo,推出了最新世界模型 Waymo World Model,其基于 DeepMind 的 Genie 3 构建,在大规模、超真实自动驾驶仿真方面树立了全新的行业标杆。

来自主题: AI资讯
9393 点击    2026-02-08 12:09
人形机器人的真机强化学习! ICLR 2026 通研院提出人形机器人预训练与真机微调新范式

人形机器人的真机强化学习! ICLR 2026 通研院提出人形机器人预训练与真机微调新范式

人形机器人的真机强化学习! ICLR 2026 通研院提出人形机器人预训练与真机微调新范式

目前,人形机器人已经能在现实中跳舞、奔跑、甚至完成后空翻。但接下来更关键的问题是:这些系统能否在部署之后持续地进行强化学习 —— 在真实世界的反馈中变得更稳定、更可靠,并在分布不断变化的新环境里持续适应与改进?

来自主题: AI技术研报
10479 点击    2026-02-08 11:56
小米给KV Cache减负80%!MiMo团队推出混合稀疏注意力架构

小米给KV Cache减负80%!MiMo团队推出混合稀疏注意力架构

小米给KV Cache减负80%!MiMo团队推出混合稀疏注意力架构

小米MiMo大模型团队,加入AI拜年战场——推出HySparse,一种面向Agent时代的混合稀疏注意力架构。

来自主题: AI技术研报
7592 点击    2026-02-08 11:53
ICLR 2026|UIUC:一行代码彻底解决LLM推理的过度思考!

ICLR 2026|UIUC:一行代码彻底解决LLM推理的过度思考!

ICLR 2026|UIUC:一行代码彻底解决LLM推理的过度思考!

2025 年 1 月 20 日,DeepSeek 发布了推理大模型 DeepSeek-R1,在学术界和工业界引发了对大模型强化学习方法的广泛关注与研究热潮。 研究者发现,在数学推理等具有明确答案的任务

来自主题: AI技术研报
6639 点击    2026-02-08 11:52