AI资讯新闻榜单内容搜索-deepseek

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: deepseek

国产大模型杀疯了，MiniMax-M2.5即将开源！

国产大模型杀疯了，MiniMax-M2.5即将开源！

国产大模型杀疯了，MiniMax-M2.5即将开源！

这两天 AI 圈真的太热闹了，就在网传 DeepSeek 要更新支持 100 万 Token 上下文的新模型时，MiniMax 率先冲锋，更新了他们的新旗舰模型：MiniMax-M2.5。更有意思的是，国外网友这段时间对国内 AI 大模型的更新节奏格外关注，他们甚至把这种争先更新的现象称为：Happy Chinese new year！

来自主题: AI资讯

11158 点击 2026-02-12 18:07

决定了：过年攻略全都不过脑子，让AI去想

决定了：过年攻略全都不过脑子，让AI去想

决定了：过年攻略全都不过脑子，让AI去想

春节还没到，「过年的气氛」已经渗入科技圈每个人的毛孔。单说 AI 大模型这一块，刚刚发布的有 kimi 2.5 和 Step 3.5 Flash，即将发布的据说还有 DeepSeek V4，GPT-5.3、Claude Sonnet 5、Qwen 3.5，GLM-5，说不定一觉醒来，现有的技术就要被颠覆。

来自主题: AI技术研报

6681 点击 2026-02-12 15:32

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

过去一年，大模型写代码的能力几乎以肉眼可见的速度提升。从简单脚本到完整功能模块，GPT、Claude、DeepSeek 等模型已经能够在几秒钟内生成看起来相当 “专业” 的代码。

来自主题: AI技术研报

8176 点击 2026-02-12 14:56

刚刚，DeepSeek悄悄测试新模型：百万token上下文、知识库更新，V4要来了？

刚刚，DeepSeek悄悄测试新模型：百万token上下文、知识库更新，V4要来了？

刚刚，DeepSeek悄悄测试新模型：百万token上下文、知识库更新，V4要来了？

春节假期还没到，DeepSeek 就先把礼物拆了一半。

来自主题: AI资讯

10495 点击 2026-02-12 11:29

GLM-5架构曝光，智谱两日涨60%：采用DeepSeek同款稀疏注意力

GLM-5架构曝光，智谱两日涨60%：采用DeepSeek同款稀疏注意力

GLM-5架构曝光，智谱两日涨60%：采用DeepSeek同款稀疏注意力

不管Pony Alpha是不是智谱的，下一代旗舰大模型GLM-5都要来了。GLM-5采用了DeepSeek-V3/V3.2架构，包括稀疏注意力机制（DSA）和多Token预测（MTP），总参数量745B，是上一代GLM-4.7的2倍。

来自主题: AI资讯

9739 点击 2026-02-10 16:27

训练加速1.8倍，推理开销降78%！精准筛选题目高效加速RL训练丨清华KDD

训练加速1.8倍，推理开销降78%！精准筛选题目高效加速RL训练丨清华KDD

训练加速1.8倍，推理开销降78%！精准筛选题目高效加速RL训练丨清华KDD

以DeepSeek R1为代表的一系列基于强化学习（RLVR）微调的工作，显著提升了大语言模型的推理能力。但在这股浪潮背后，强化微调的代价却高得惊人。

来自主题: AI技术研报

9978 点击 2026-02-10 14:19

ICLR 2026｜UIUC：一行代码彻底解决LLM推理的过度思考！

ICLR 2026｜UIUC：一行代码彻底解决LLM推理的过度思考！

ICLR 2026｜UIUC：一行代码彻底解决LLM推理的过度思考！

2025 年 1 月 20 日，DeepSeek 发布了推理大模型 DeepSeek-R1，在学术界和工业界引发了对大模型强化学习方法的广泛关注与研究热潮。研究者发现，在数学推理等具有明确答案的任务

来自主题: AI技术研报

7164 点击 2026-02-08 11:52

陈天桥邓亚峰联手破解大模型记忆难题！4个月打造SOTA系统，悬赏8万美元发起全球记忆挑战赛

陈天桥邓亚峰联手破解大模型记忆难题！4个月打造SOTA系统，悬赏8万美元发起全球记忆挑战赛

陈天桥邓亚峰联手破解大模型记忆难题！4个月打造SOTA系统，悬赏8万美元发起全球记忆挑战赛

开年，DeepSeek论文火遍全网，内容聚焦大模型记忆。

来自主题: AI技术研报

8772 点击 2026-02-06 10:35

曝DeepSeek春节不发大招，友商疯狂偷家

曝DeepSeek春节不发大招，友商疯狂偷家

曝DeepSeek春节不发大招，友商疯狂偷家

就在刚刚，据《南华早报》援引知情人士最新消息，智谱 AI 计划在未来两周内，也就是春节前发布其新旗舰模型 GLM-5。与此同时，MiniMax 也预计将于春节前发布 M2.2 模型，这是在原有 M2.1 基础上进行的小幅更新，重点提升编程能力。

来自主题: AI资讯

14697 点击 2026-02-02 23:07

开源免费！推荐一款基于DeepSeek大模型RAG知识库与知识图谱平台，打通飞书、企业微信、钉钉

开源免费！推荐一款基于DeepSeek大模型RAG知识库与知识图谱平台，打通飞书、企业微信、钉钉

开源免费！推荐一款基于DeepSeek大模型RAG知识库与知识图谱平台，打通飞书、企业微信、钉钉

语析Yuxi-Know 是基于大模型RAG知识库与知识图谱技术构建的智能问答平台，支持多种知识库文件格式，如PDF、TXT、MD、Docx，支持将文件内容转换为向量存储，便于快速检索。

来自主题: AI技术研报

6797 点击 2026-02-02 13:23

上一页当前第13页,共119页下一页