AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
ICML 2025 | 长视频理解新SOTA!蚂蚁&人大开源ViLAMP-7B,单卡可处理3小时视频

ICML 2025 | 长视频理解新SOTA!蚂蚁&人大开源ViLAMP-7B,单卡可处理3小时视频

ICML 2025 | 长视频理解新SOTA!蚂蚁&人大开源ViLAMP-7B,单卡可处理3小时视频

在视觉语言模型(Vision-Language Models,VLMs)取得突破性进展的当下,长视频理解的挑战显得愈发重要。以标准 24 帧率的标清视频为例,仅需数分钟即可产生逾百万的视觉 token,这已远超主流大语言模型 4K-128K 的上下文处理极限。

来自主题: AI技术研报
5072 点击    2025-05-13 08:54
全球首次实测通过!CMU华人用AI设计的乐高「不翻车」

全球首次实测通过!CMU华人用AI设计的乐高「不翻车」

全球首次实测通过!CMU华人用AI设计的乐高「不翻车」

如何将一句简单的文字描述变成物理稳定的乐高模型?LegoGPT通过物理感知技术,确保98.8%的设计稳如磐石。

来自主题: AI资讯
7948 点击    2025-05-12 16:12
国内首个光子芯片专用大模型 OptoChat AI 重磅亮相

国内首个光子芯片专用大模型 OptoChat AI 重磅亮相

国内首个光子芯片专用大模型 OptoChat AI 重磅亮相

在新一轮科技革命与产业变革的汹涌浪潮中,光子技术作为构筑未来信息社会的核心基建,正以加速度驶入智能化与规模化协同发展的深水区。作为支撑新质生产力体系的重要支柱,光子技术在信息传输、智能计算、感知交互等战略领域,发挥着不可替代的关键作用,已然成为驱动未来产业生态跃迁的核心引擎。

来自主题: AI资讯
7141 点击    2025-05-12 15:12
CVPR2025|MCA-Ctrl:多方协同注意力控制助力AIGC时代图像精准定制化

CVPR2025|MCA-Ctrl:多方协同注意力控制助力AIGC时代图像精准定制化

CVPR2025|MCA-Ctrl:多方协同注意力控制助力AIGC时代图像精准定制化

近年来,生成式人工智能(Generative AI)技术的突破性进展,特别是文本到图像 T2I 生成模型的快速发展,已经使 AI 系统能够根据用户输入的文本提示(prompt)生成高度逼真的图像。从早期的 DALL・E 到 Stable Diffusion、Midjourney 等模型,这一领域的技术迭代呈现出加速发展的态势。

来自主题: AI技术研报
9406 点击    2025-05-12 14:59
RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力

RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力

RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力

多模态奖励模型(MRMs)在提升多模态大语言模型(MLLMs)的表现中起着至关重要的作用,在训练阶段可以提供稳定的 reward,评估阶段可以选择更好的 sample 结果,甚至单独作为 evaluator。

来自主题: AI技术研报
7300 点击    2025-05-12 14:51