AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力

RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力

RL训练总崩溃?R1-Reward稳定解锁奖励模型Long-Cot推理能力

多模态奖励模型(MRMs)在提升多模态大语言模型(MLLMs)的表现中起着至关重要的作用,在训练阶段可以提供稳定的 reward,评估阶段可以选择更好的 sample 结果,甚至单独作为 evaluator。

来自主题: AI技术研报
7213 点击    2025-05-12 14:51
8秒极速生成!复杂场景图像定制低成本轻松驾驭,已开源丨字节北大联合发布

8秒极速生成!复杂场景图像定制低成本轻松驾驭,已开源丨字节北大联合发布

8秒极速生成!复杂场景图像定制低成本轻松驾驭,已开源丨字节北大联合发布

可控图片生成,如今已经不是什么新鲜事。甚至也不需要复杂的提示词,用户通过简单的文本描述,就能快速生成符合个人需求的创意图像。

来自主题: AI技术研报
7918 点击    2025-05-12 14:07
现在的大学生,不用大模型才是异类

现在的大学生,不用大模型才是异类

现在的大学生,不用大模型才是异类

「大学现在学的就是掌握 ChatGPT 的程度了。」

来自主题: AI资讯
9234 点击    2025-05-12 11:41
转身世界就变样?WorldMem用记忆让AI生成的世界拥有了一致性

转身世界就变样?WorldMem用记忆让AI生成的世界拥有了一致性

转身世界就变样?WorldMem用记忆让AI生成的世界拥有了一致性

近年来,基于视频生成模型的可交互世界生成引发了广泛关注。尽管现有方法在生成质量和交互能力上取得了显著进展,但由于上下文时间窗口受限,生成的世界在长时序下严重缺乏一致性。

来自主题: AI技术研报
7957 点击    2025-05-12 11:05
多模态=AGI入场券?阶跃星辰姜大昕:死磕基座大模型,探索多模态理解生成一体化

多模态=AGI入场券?阶跃星辰姜大昕:死磕基座大模型,探索多模态理解生成一体化

多模态=AGI入场券?阶跃星辰姜大昕:死磕基座大模型,探索多模态理解生成一体化

当大模型赛道中不少玩家明确表示放弃基础大模型研发,心思放在更聚焦的方向上时,阶跃星辰站出来——就像这家公司第一次亮相时那样,给外界一个明确的回答:

来自主题: AI资讯
5904 点击    2025-05-12 10:36
SIGGRAPH 2025 | 快手可灵团队提出3D感知的可控电影级视频生成工作CineMaster!

SIGGRAPH 2025 | 快手可灵团队提出3D感知的可控电影级视频生成工作CineMaster!

SIGGRAPH 2025 | 快手可灵团队提出3D感知的可控电影级视频生成工作CineMaster!

Sora、可灵等视频生成模型令人惊艳的性能表现使得创作者仅依靠文本输入就能够创作出高质量的视频内容。然而,我们常见的电影片段通常是由导演在一个场景中精心布置多个目标的运动、摄像机拍摄角度后再剪辑而成的。例如,在拍摄赛车追逐的场景时,镜头通常跟随赛车运动,并通过扣人心弦的超车时刻来展示赛事的白热化。

来自主题: AI技术研报
9076 点击    2025-05-12 10:31
斯坦福的以弱驭强W4S,用Meta-Agent驾驭更强的LLM,准确率提升至95.4% | 最新

斯坦福的以弱驭强W4S,用Meta-Agent驾驭更强的LLM,准确率提升至95.4% | 最新

斯坦福的以弱驭强W4S,用Meta-Agent驾驭更强的LLM,准确率提升至95.4% | 最新

本文详细介绍了斯坦福大学最新提出的"以弱驭强"(W4S)范式,这一创新方法通过训练轻量级的弱模型来优化强大语言模型的工作流。核心亮点包括:

来自主题: AI技术研报
7974 点击    2025-05-12 10:10
美团独投A轮,这家「具身智能」公司已融资超10亿

美团独投A轮,这家「具身智能」公司已融资超10亿

美团独投A轮,这家「具身智能」公司已融资超10亿

《智能涌现》获悉,具身智能公司「自变量机器人」近日完成数亿元A轮融资,由美团战投领投、美团龙珠跟投。 本轮融资将用于持续加速全自研端到端通用具身智能大模型与机器人本体的同步迭代,以及未来多个应用场景的智慧化方案合作和落地。

来自主题: AI资讯
7993 点击    2025-05-12 10:00