AI资讯新闻榜单内容搜索-Qwen2

「DeepSeek二代」来袭！数学暴击o3，英伟达开源LLM登顶

基于Qwen2.5架构，采用DeepSeek-R1-0528生成数据，英伟达推出的OpenReasoning-Nemotron模型，以超强推理能力突破数学、科学、代码任务，在多个基准测试中创下新纪录！数学上，更是超越了o3!

来自主题: AI资讯

10431 点击 2025-07-20 23:43

小红书hi lab首次开源文本大模型，训练资源不到Qwen2.5 72B 的四分之一

6 月 6 日，小红书 hi lab（Humane Intelligence Lab，人文智能实验室）团队首次开源了文本大模型 dots.llm1，采用 MIT 许可证。

来自主题: AI资讯

10230 点击 2025-06-07 12:12

为什么李飞飞团队经常cue通义千问？

Qwen 3还未发布，但已发布的Qwen系列含金量还在上升。2个月前，李飞飞团队基于Qwen2.5-32B-Instruct 模型，以不到50美元的成本训练出新模型 S1-32B，取得了与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型数学及编码能力相当的效果。如今，他们的视线再次投向了这个国产模型。

来自主题: AI资讯

10073 点击 2025-04-12 12:02

7B模型搞定AI视频通话，阿里最新开源炸场，看听说写全模态打通，开发者企业免费商用

深夜重磅！阿里发布并开源首个端到端全模态大模型——

来自主题: AI技术研报

10989 点击 2025-03-27 15:18

阿里深夜开源Qwen2.5-Omni，7B参数完成看、听、说、写

3 月 27 日凌晨，阿里通义千问团队发布 Qwen2.5-Omni。

来自主题: AI资讯

11789 点击 2025-03-27 09:27

32B本地部署！阿里开源最新多模态模型：主打视觉语言，数学推理也很强

就在DeepSeek-V3更新的同一夜，阿里通义千问Qwen又双叒叕一次梦幻联动了——

来自主题: AI资讯

11683 点击 2025-03-25 11:47

啪啪打脸！Search-R1让DeepSeek-R1实时获取信息，实现26%提升的争议与启发 | 最新

本文介绍了Search-R1技术，这是一项通过强化学习训练大语言模型进行推理并利用搜索引擎的创新方法。实验表明，Search-R1在Qwen2.5-7B模型上实现了26%的性能提升，使模型能够实时获取准确信息并进行多轮推理。本文详细分析了Search-R1的工作原理、训练方法和实验结果，为AI产品开发者提供了重要参考。

来自主题: AI技术研报

12524 点击 2025-03-20 09:48