独家｜梁文锋将携DeepSeek V4撞上姚顺雨

12095点击 2026-03-12 17:20

我们独家获悉，外界千呼万唤的DeepSeek-V4将于4月正式上线。作为梁文锋打磨已久的多模态大模型，DeepSeek-V4除了在Coding能力上跃升之外，还将在LTM（long term memory长期记忆）上取得突破。

一位接近DeepSeek的人士告诉我们，梁文锋近半年的主要工作是补齐DeepSeek此前在视觉内容处理，以及AI搜索等方面的短板。为了强化DeepSeek的AI搜索能力，DeepSeek早在去年就与百度合作。

自去年1月，DeepSeek发布风靡全球的推理模型DeepSeek-R1以来，一直未有大版本的模型迭代。市场上有关DeepSeek大迭代版本模型即将到来的消息，每隔一段时间总会掀起一阵"It's coming"的讨论。

人们在全网专业平台上试图捕捉DeepSeek新版本的迹象。

3月11日，全球最大的AI模型API聚合平台OpenRouter上线两个隐身模型，分别是Healer Alpha和Hunter Alpha。Healer Alpha是一款前沿的全模态模型，能够原生感知视觉和听觉输入，进行跨模态推理，并精确可靠地执行复杂的多步骤任务，但上下文只有26万。

Hunter Alpha专为智能体应用构建，是一个拥有上万亿参数和100万token上下文的智能模型。该模型介绍里还显示，它擅长长期规划、复杂推理和持续的多步骤任务执行，并具备OpenClaw等框架所需的可靠性和指令执行精度。

针对这两个模型，X上又出现一波DeepSeek-V4要来了的声音。不过从此前公开报道的DeepSeek-V4来看，DeepSeek-V4具有万亿参数，100万长上下文，同时具备原生多模态能力，支持文本、图像、视频的联合理解与生成。

OpenRouter上的这两个隐身模型的特征与之并不完全吻合。

根据我们的独家信源，梁文锋待推出的DeepSeek-V4迭代的方向，正是大模型领域今年“皇冠上的明珠”—LTM。

最近半年（2025年9月11日-2026年3月11日），梁文锋署名的论文主要有三篇。其中《DeepSeek-R1 推理模型研究》发表于国际顶级期刊《Nature》，另有两篇为预印本论文《mHC（流形约束超连接）框架》，《条件记忆：大语言模型稀疏性的新维度》。

梁文锋及其团队在近半年的研究成果，也呈现出清晰的技术演进路线。

通过DeepSeek-R1确立了推理能力的强化学习范式后，DeepSeek正进一步探索底层架构创新。特别是通过“条件记忆”（Engram）等新模块，试图在提升模型性能的同时，解决传统Transformer架构在记忆和算力方面的瓶颈，也是为DeepSeek-V4做技术储备。

同时，V4还将深度适配国产芯片，有望成为第一个完全跑在“国产算力生态”上的大模型。

4月，中国大模型竞技场上依然会很热闹。除了备受瞩目的DeepSeek，我们从腾讯内部了解到，作为腾讯首席AI科学家姚顺雨也将发布混元新模型（30B参数级别）。

姚顺雨在去年12月官宣正式加入腾讯后，一直忙于模型和产品的开发。据悉，早在去年年初姚顺雨就接受邀请回国，不同于外界所传姚顺雨仅有半年的时间推出新模型，实际上，姚顺雨对新模型的准备早已开始。

而姚顺雨的30B参数模型，在动辄千亿、万亿参数的今天，显得有些“小巧”。不过，这恰恰符合姚顺雨的理念——方法的复杂程度，应该和任务本身的难度相匹配，真正的突破来自于用最优雅的方法解决最复杂的问题。

在腾讯内部，姚顺雨也要求团队成员不要以打榜为导向。

梁文锋和姚顺雨，一位是“全村人都在等着上桌吃饭”的明星创业者，一位是“从硅谷空降回来改造大厂”的95后明星科学家。他们作为备受瞩目的国产大模型核心人物，会怎么影响模型格局，目前尚未可知。

不过，从外部看，两人面临的压力大不相同。

对梁文锋而言，DeepSeek APP的MAU已经超过1亿，但在R1火爆全球之后，大家的期待也被抬到了前所未有的高度。V4的压力正是来源于必须再次成为全世界最出色的开源大模型。

更何况春节前后，豆包、千问、智谱、MiniMax等竞争对手陆续发布新版本，这被视为对DeepSeek的“预防性竞争行为”。从春节一直迟到至今的V4，让市场的焦躁与日俱增。

而对姚顺雨而言，压力则来自于腾讯大模型需要证明自己。

过去两年，腾讯在大模型上的节奏相对谨慎，混元大模型在元宝APP和微信内，长期被作为DeepSeek之外的第二选项存在。姚顺雨也被寄予厚望，他需要帮腾讯AI大模型找到长期表现欠佳的病根，并用实际的产品证明，腾讯拥有后发制人的能力。

压力的另一面也是动力，我们不妨期待4月，国产模型真的能把全球大模型进展再推上一个台阶。

文章来自于“白鲸实验室”，作者 “马舒叶”。

AI新闻 deepseek deepseek V4 梁文峰

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/