AI资讯新闻榜单内容搜索-训练模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 训练模型

AI生成视频总不符合物理规律？匹兹堡大学团队新作PhyT2V：不重训练模型也能让物理真实度狂飙2.3倍！

AI生成视频总不符合物理规律？匹兹堡大学团队新作PhyT2V：不重训练模型也能让物理真实度狂飙2.3倍！

AI生成视频总不符合物理规律？匹兹堡大学团队新作PhyT2V：不重训练模型也能让物理真实度狂飙2.3倍！

本文由匹兹堡大学智能系统实验室（Intelligent Systems Laboratory）的研究团队完成。第一作者为匹兹堡大学的一年级博士生薛琪耀。

来自主题: AI技术研报

10135 点击 2025-05-19 14:12

全球闲置算力训个模型，性能媲美R1，老黄天塌了！Karpathy曾投资它

全球闲置算力训个模型，性能媲美R1，老黄天塌了！Karpathy曾投资它

全球闲置算力训个模型，性能媲美R1，老黄天塌了！Karpathy曾投资它

一夜之间，老黄天塌了（doge）。

来自主题: AI技术研报

10559 点击 2025-05-13 15:30

字节Seed团队PHD-Transformer突破预训练长度扩展！破解KV缓存膨胀难题

字节Seed团队PHD-Transformer突破预训练长度扩展！破解KV缓存膨胀难题

字节Seed团队PHD-Transformer突破预训练长度扩展！破解KV缓存膨胀难题

最近，DeepSeek-R1 和 OpenAI o1/03 等推理大模型在后训练阶段探索了长度扩展（length scaling），通过强化学习（比如 PPO、GPRO）训练模型生成很长的推理链（CoT），并在奥数等高难度推理任务上取得了显著的效果提升。

来自主题: AI技术研报

8487 点击 2025-04-28 14:09

自己训练模型才能掌握未来？一股脑押注应用层或许值得警惕

自己训练模型才能掌握未来？一股脑押注应用层或许值得警惕

自己训练模型才能掌握未来？一股脑押注应用层或许值得警惕

模型即产品？

来自主题: AI技术研报

7697 点击 2025-03-08 13:33

月之暗面Kimi的技术一点都不落后。

月之暗面Kimi的技术一点都不落后。

月之暗面Kimi的技术一点都不落后。

2 月 18 日，月之暗面发布了一篇关于稀疏注意力框架 MoBA 的论文。MoBA 框架借鉴了 Mixture of Experts（MoE）的理念，提升了处理长文本的效率，它的上下文长度可扩展至 10M。并且，MoBA 支持在全注意力和稀疏注意力之间无缝切换，使得与现有的预训练模型兼容性大幅提升。

来自主题: AI技术研报

10130 点击 2025-02-23 11:38

TPAMI-2024 | Uni-AdaFocus视频理解框架，让AI学会「划重点」，计算效率提升4-23倍！

TPAMI-2024 | Uni-AdaFocus视频理解框架，让AI学会「划重点」，计算效率提升4-23倍！

TPAMI-2024 | Uni-AdaFocus视频理解框架，让AI学会「划重点」，计算效率提升4-23倍！

Uni-AdaFocus 是一个通用的高效视频理解框架，实现了降低时间、空间、样本三维度冗余性的统一建模。代码和预训练模型已开源，还有在自定义数据集上使用的完善教程，请访问项目链接。

来自主题: AI资讯

9009 点击 2025-01-18 10:03

算力直降97%，GPT-3存储只用20MB？！这篇直接在1.58-bit下训练模型的新论文火了

算力直降97%，GPT-3存储只用20MB？！这篇直接在1.58-bit下训练模型的新论文火了

算力直降97%，GPT-3存储只用20MB？！这篇直接在1.58-bit下训练模型的新论文火了

好家伙！1750亿参数的GPT-3只需20MB存储空间了？！基于1.58-bit训练，在不损失精度的情况下，大幅节省算力（↓97%）和存储（↓90%）。

来自主题: AI技术研报

9350 点击 2024-12-29 17:42

AAAI 2025 | 开放世界的深伪检测，北交大团队：解决好无配对数据挑战很重要

AAAI 2025 | 开放世界的深伪检测，北交大团队：解决好无配对数据挑战很重要

AAAI 2025 | 开放世界的深伪检测，北交大团队：解决好无配对数据挑战很重要

现有的深伪检测方法大多依赖于配对数据，即一张压缩图像和其对应的原始图像来训练模型，这在许多实际的开放环境中并不适用。尤其是在社交媒体等开放网络环境（OSN）中，图像通常经过多种压缩处理，导致图像质量受到影响，深伪识别也因此变得异常困难。

来自主题: AI技术研报

9862 点击 2024-12-23 09:44

3D具身基础模型！北大提出Lift3D赋予2D大模型鲁棒的3D操纵能力

3D具身基础模型！北大提出Lift3D赋予2D大模型鲁棒的3D操纵能力

3D具身基础模型！北大提出Lift3D赋予2D大模型鲁棒的3D操纵能力

为了构建鲁棒的 3D 机器人操纵大模型，Lift3D 系统性地增强 2D 大规模预训练模型的隐式和显式 3D 机器人表示，并对点云数据直接编码进行 3D 模仿学习。Lift3D 在多个仿真环境和真实场景中实现了 SOTA 的操纵效果，并验证了该方法的泛化性和可扩展性。

来自主题: AI技术研报

8813 点击 2024-12-09 14:55

美欧亚三洲开发者联手，全球首个组团训练的大模型来了，全流程开源

美欧亚三洲开发者联手，全球首个组团训练的大模型来了，全流程开源

美欧亚三洲开发者联手，全球首个组团训练的大模型来了，全流程开源

Prime Intellect 宣布通过去中心化方式训练完成了一个 10B 模型。30 号，他们开源了一切，包括基础模型、检查点、后训练模型、数据、PRIME 训练框架和技术报告。据了解，这应该是有史以来首个以去中心化形式训练得到的 10B 大模型。

来自主题: AI资讯

9494 点击 2024-12-02 12:35

上一页当前第3页,共5页下一页