AI资讯新闻榜单内容搜索-模型

视频生成的测试时Scaling时刻！清华开源Video-T1，无需重新训练让性能飙升

视频作为包含大量时空信息和语义的媒介，对于 AI 理解、模拟现实世界至关重要。视频生成作为生成式 AI 的一个重要方向，其性能目前主要通过增大基础模型的参数量和预训练数据实现提升，更大的模型是更好表现的基础，但同时也意味着更苛刻的计算资源需求。

来自主题: AI技术研报

8257 点击 2025-03-26 14:43

你定个主题，用AgentRxiv可以让DeepSeek-v3自主搞科研写论文，效率暴增14% |最新

这项来自约翰霍普金斯与ETH Zurich的自主科研智能体框架AgentRxiv的确可以显著提高研究效率。我在测试了多次之后用Deepseek-V3-0324实现了它。

来自主题: AI技术研报

6759 点击 2025-03-26 14:37

谷歌地表最强模型深夜来袭！Gemini 2.5 Pro发布即屠榜，代码推理杀疯了

Gemini 2.5 Pro，刚刚深夜上线了！这个「思考」模型专为复杂任务打造，推理能力强大，一经诞生就横扫各大榜单、拿下各类TOP 1，还创下了历史上最大分数飞跃纪录。

来自主题: AI资讯

9787 点击 2025-03-26 11:43

全球首发骨科大模型！哈佛科学家回国创业，AI+骨科“零的突破”！

近日，第十九届华西国际骨科论坛暨华西医院骨科学科联盟第六届学术交流大会在成都召开，400余位国内外骨科领域知名专家学者莅临参会。

来自主题: AI资讯

7300 点击 2025-03-26 11:07

随手一拍，高效重建大型3D开放场景，港科广GraphGS突破传统重建技术瓶颈｜ICLR 2024

从手机随手拍、汽车行车记录仪到无人机航拍，如何从海量无序二维图像快速生成高精度三维场景？

来自主题: AI技术研报

9545 点击 2025-03-26 09:52

视频可以精准控制了！一句话给熊戴眼镜的那种，扩散模型立功，浙大悉尼科技大学出品 | ICLR 2025

如何让你的模型能感知到视频的粒度，随着你的心思想编辑哪就编辑哪呢？

来自主题: AI技术研报

8465 点击 2025-03-26 09:36

爆料！宝马与阿里达成AI合作，推荐大模型在新世代系列车型中的应用

据传宝马将与阿里达成全面AI合作，阿里通义大模型将应用于中国市场的宝马新世代系列车型。近年来，大模型正加速汽车行业AI化，尤其是与用户直接交互的智能车载领域。

来自主题: AI资讯

9843 点击 2025-03-26 09:32

Uni-3DAR用自回归统一微观与宏观的3D世界，性能超扩散模型256%，推理快21.8倍

它名为 Uni-3DAR，来自深势科技、北京科学智能研究院及北京大学，是一个通过自回归下一 token 预测任务将 3D 结构的生成与理解统一起来的框架。据了解，Uni-3DAR 是世界首个此类科学大模型。并且其作者阵容非常强大，包括了深势科技 AI 算法负责人柯国霖、中国科学院院士鄂维南、深势科技创始人兼首席科学家和北京科学智能研究院院长张林峰等。

来自主题: AI技术研报

8562 点击 2025-03-26 09:10

挖掘DiT的位置解耦特性，Personalize Anything免训练实现个性化图像生成

，清华大学、北京航空航天大学团队推出了全新的架构设计 ——Personalize Anything，它能够在无需训练的情况下，完成概念主体的高度细节还原，支持用户对物体进行细粒度的位置操控，并能够扩展至多个应用中，为个性化图像生成引入了一个新范式。

来自主题: AI技术研报

8548 点击 2025-03-26 09:04

DeepSeek逼出谷歌新推理模型：40分优势超GPT4.5登顶竞技场，支持原生多模态，但依然败给了“竹竿问题”

又双叒，抢在OpenAI直播之前，谷歌Gemini 2.5系列来了。首个版本Pro Experimental一登场就抢下大模型竞技场第一名，并且整整比GPT-4.5高出40分Gemini 2.5同样是推理模型，用Jeff Dean的说法是：

来自主题: AI资讯

9061 点击 2025-03-26 08:40