AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
14B规模竟也能单卡实时生成视频?多亏这个强大的开源底座

14B规模竟也能单卡实时生成视频?多亏这个强大的开源底座

14B规模竟也能单卡实时生成视频?多亏这个强大的开源底座

春节期间, Seedance 2.0 爆火,堪称现象级,这也再次把视频生成推上风口。前两天,字节跳动又携手北大、安努智能和 Canva 共同开源了具备实时生成能力的视频模型 Helios 家族。该系列包含了 Helios-Base、Helios-Mid 与 Helios-Distilled 三个版本,全面覆盖了 T2V、I2V、V2V 以及交互式生成任务。

来自主题: AI技术研报
9003 点击    2026-03-09 15:05
CVPR 2026 | AI寒武纪时刻?字节世界模型新作,仅靠视觉学习真实世界知识

CVPR 2026 | AI寒武纪时刻?字节世界模型新作,仅靠视觉学习真实世界知识

CVPR 2026 | AI寒武纪时刻?字节世界模型新作,仅靠视觉学习真实世界知识

视觉世界模型 “VideoWorld 2” 由豆包大模型团队与北京交通大学联合提出。不同于 Sora 2 、Veo 3、Wan 2.2 等主流多模态模型,VideoWorld 系列工作在业界首次实现无需依赖语言模型,即可认知世界。

来自主题: AI技术研报
5248 点击    2026-03-09 14:29
一个模型,搞定所有音频生成任务!多项基准SOTA | ICLR'26

一个模型,搞定所有音频生成任务!多项基准SOTA | ICLR'26

一个模型,搞定所有音频生成任务!多项基准SOTA | ICLR'26

港科大团队提出音频生成统一模型AudioX,只需一个模型,就能从文本、视频、图像等任意模态生成高质量音效和音乐,在多项基准上超越专家模型。团队同时开源了700万样本的细粒度标注数据集IF-caps与可控T2A评测基准T2A-bench,并在该基准上大幅领先现有方法。论文已被ICLR 2026接收。

来自主题: AI技术研报
6909 点击    2026-03-09 14:29
ICLR 2026 | 帝国理工大学提出DyMo:让多模态模型学会「选择」,突破模态缺失难题

ICLR 2026 | 帝国理工大学提出DyMo:让多模态模型学会「选择」,突破模态缺失难题

ICLR 2026 | 帝国理工大学提出DyMo:让多模态模型学会「选择」,突破模态缺失难题

多模态学习(Multimodal Learning)正在推动 AI 在医学影像、自动驾驶、人机交互等领域取得突破。通过融合图像、文本、表格等多种模态,模型能够获得更全面的信息,从而显著提升性能。

来自主题: AI技术研报
8392 点击    2026-03-09 14:28
AI 真能做研究吗?UniPat AI开源UniScientist,用30B小模型给出肯定答案

AI 真能做研究吗?UniPat AI开源UniScientist,用30B小模型给出肯定答案

AI 真能做研究吗?UniPat AI开源UniScientist,用30B小模型给出肯定答案

多数大模型能生成 “看起来像” 研究的文本,但极少数能真正做研究 —— 提出假设、收集证据、执行可复现的推导、迭代验证直至结论成立。

来自主题: AI技术研报
5782 点击    2026-03-09 14:27
独家|聚焦大模型推理,水下AI芯片公司斩获10亿元Pre-A轮融资

独家|聚焦大模型推理,水下AI芯片公司斩获10亿元Pre-A轮融资

独家|聚焦大模型推理,水下AI芯片公司斩获10亿元Pre-A轮融资

ZP独家获悉,AI芯片及系统架构研发商“上海昉擎科技”于近日完成 Pre-A3 轮融资,新引入投资人国开科创、钧山资本、建发新兴投资、多维资本,多维资本担任本轮融资财务顾问并担任后续融资独家财务顾问。

来自主题: AI资讯
7878 点击    2026-03-09 10:49
全网都在吹OpenClaw,我们更关心谁在为它买单

全网都在吹OpenClaw,我们更关心谁在为它买单

全网都在吹OpenClaw,我们更关心谁在为它买单

作为2月刷屏的现象级开源产品,OpenClaw不仅自身掀起了AI工具的使用热潮,成为全球最大API聚合平台OpenRouter上的Tokens消耗最多的应用,更成为了国产大模型出海的关键推手。

来自主题: AI资讯
9489 点击    2026-03-09 10:03