AI资讯新闻榜单内容搜索-训练

无限生成视频，还能规划决策，扩散强制整合下一token预测与全序列扩散

近日，MIT CSAIL 的一个研究团队（一作为 MIT 在读博士陈博远）成功地将全序列扩散模型与下一 token 模型的强大能力统合到了一起，提出了一种训练和采样范式：Diffusion Forcing（DF）。

来自主题: AI技术研报

5457 点击 2024-07-23 16:40

这是人类首次证明神经网络可以创建自己的地图。

来自主题: AI资讯

6122 点击 2024-07-23 16:29

10万块液冷H100正式开工，马斯克19天建成世界最强AI训练集群。

来自主题: AI资讯

5956 点击 2024-07-23 16:03

苹果最新杀入开源大模型战场，而且比其他公司更开放。推出7B模型，不仅效果与Llama 3 8B相当，而且一次性开源了全部训练过程和资源。大模型，AI，苹果AI，苹果开源模型

来自主题: AI资讯

8730 点击 2024-07-23 00:14

小模型强势来袭，「大模型时代」或将落幕？

来自主题: AI资讯

8974 点击 2024-07-22 15:04

多模态大模型（Multimodal Large Language Models，MLLMs）在不同的任务中表现出了令人印象深刻的能力，尽管如此，这些模型在检测任务中的潜力仍被低估。

来自主题: AI技术研报

11701 点击 2024-07-22 14:58

数据是大语言模型（LLMs）成功的基石，但并非所有数据都有益于模型学习。

来自主题: AI技术研报

10525 点击 2024-07-22 14:55

编码器模型哪去了？如果 BERT 效果好，那为什么不扩展它？编码器 - 解码器或仅编码器模型怎么样了？

来自主题: AI资讯

9710 点击 2024-07-22 14:50

如果你是一位网文作者，在和平台签约的时候，忽然临时被加了一条“AI训练补充协议”，要求你同意把作品“喂”给平台的AI，用于内容开发，你会怎么想？

来自主题: AI资讯

8124 点击 2024-07-22 10:34

针对视觉-语言预训练（Vision-Language Pretraining, VLP）模型的对抗攻击，现有的研究往往仅关注对抗轨迹中对抗样本周围的多样性，但这些对抗样本高度依赖于代理模型生成，存在代理模型过拟合的风险。

来自主题: AI技术研报

10932 点击 2024-07-21 17:12