AI资讯新闻榜单内容搜索-训练

CVPR 2025：长Prompt对齐问题也能评估了！当前最大AIGC评估数据集，模型评分超越当前SOTA

今年，CVPR共有13008份有效投稿并进入评审流程，其中2878篇被录用，最终录用率为22.1%。

来自主题: AI技术研报

8352 点击 2025-03-15 14:50

何恺明LeCun暴击Transformer命门，9行代码砍掉归一化层！性能反而更强了？

Transformer架构迎来历史性突破！刚刚，何恺明LeCun、清华姚班刘壮联手，用9行代码砍掉了Transformer「标配」归一化层，创造了性能不减反增的奇迹。

来自主题: AI技术研报

8203 点击 2025-03-15 14:11

奥特曼自曝全新OpenAI写作模型：第一次被AI震撼，网友：AI写的坚决不看

OpenAI训练创意写作模型，网友质疑AI情感联系。

来自主题: AI资讯

8443 点击 2025-03-14 16:52

CVPR 2025 | VAST和北航开源MIDI，从单张图像端到端生成三维组合场景

在 Sora 引爆世界模型技术革命的当下，3D 场景作为物理世界的数字基座，正成为构建动态可交互 AI 系统的关键基础设施。当前，单张图像生成三维资产的技术突破，已为三维内容生产提供了 "从想象到三维" 的原子能力。

来自主题: AI技术研报

8859 点击 2025-03-14 15:40

MM-Eureka：极少数据实现多模态推理的R1-Zero时刻

尽管 DeepSeek-R1 在单模态推理中取得了显著成功，但已有的多模态尝试（如 R1-V、R1-Multimodal-Journey、LMM-R1）尚未完全复现其核心特征。

来自主题: AI技术研报

8654 点击 2025-03-14 15:32

速递｜Moonvalley 发布了一款视频生成器，声称其基于授权内容训练

洛杉矶初创公司 Moonvalley 推出了一款 AI 视频生成模型，该公司声称这是少数基于公开许可（非版权）数据训练的模型之一。

来自主题: AI资讯

7539 点击 2025-03-13 15:24

3700次预训练总结超参规律，开源海量实验，告别盲猜

近年来，大语言模型 LLMs 在多种任务上的卓越表现已得到广泛认可。然而，要实现其高效部署，精细的超参数优化至关重要。为了探究最佳超参数的规律，我们开展了大规模的实证研究，通过在不同配置上进行网格搜索，我们揭示了一套通用的最优超参数缩放定律（Optimal Hyperparameter Scaling Law）。

来自主题: AI技术研报

10067 点击 2025-03-13 15:15