
我们独家获悉,外界千呼万唤的DeepSeek-V4将于4月正式上线。作为梁文锋打磨已久的多模态大模型,DeepSeek-V4除了在Coding能力上跃升之外,还将在LTM(long term memory长期记忆)上取得突破。
一位接近DeepSeek的人士告诉我们,梁文锋近半年的主要工作是补齐DeepSeek此前在视觉内容处理,以及AI搜索等方面的短板。为了强化DeepSeek的AI搜索能力,DeepSeek早在去年就与百度合作。
自去年1月,DeepSeek发布风靡全球的推理模型DeepSeek-R1以来,一直未有大版本的模型迭代。市场上有关DeepSeek大迭代版本模型即将到来的消息,每隔一段时间总会掀起一阵"It's coming"的讨论。
人们在全网专业平台上试图捕捉DeepSeek新版本的迹象。
3月11日,全球最大的AI模型API聚合平台OpenRouter上线两个隐身模型,分别是Healer Alpha和Hunter Alpha。Healer Alpha是一款前沿的全模态模型,能够原生感知视觉和听觉输入,进行跨模态推理,并精确可靠地执行复杂的多步骤任务,但上下文只有26万。
Hunter Alpha专为智能体应用构建,是一个拥有上万亿参数和100万token上下文的智能模型。该模型介绍里还显示,它擅长长期规划、复杂推理和持续的多步骤任务执行,并具备OpenClaw等框架所需的可靠性和指令执行精度。
针对这两个模型,X上又出现一波DeepSeek-V4要来了的声音。不过从此前公开报道的DeepSeek-V4来看,DeepSeek-V4具有万亿参数,100万长上下文,同时具备原生多模态能力,支持文本、图像、视频的联合理解与生成。
OpenRouter上的这两个隐身模型的特征与之并不完全吻合。
根据我们的独家信源,梁文锋待推出的DeepSeek-V4迭代的方向,正是大模型领域今年“皇冠上的明珠”—LTM。
最近半年(2025年9月11日-2026年3月11日),梁文锋署名的论文主要有三篇。其中《DeepSeek-R1 推理模型研究》发表于国际顶级期刊《Nature》,另有两篇为预印本论文《mHC(流形约束超连接)框架》,《条件记忆:大语言模型稀疏性的新维度》。
梁文锋及其团队在近半年的研究成果,也呈现出清晰的技术演进路线。
通过DeepSeek-R1确立了推理能力的强化学习范式后,DeepSeek正进一步探索底层架构创新。特别是通过“条件记忆”(Engram)等新模块,试图在提升模型性能的同时,解决传统Transformer架构在记忆和算力方面的瓶颈,也是为DeepSeek-V4做技术储备。
同时,V4还将深度适配国产芯片,有望成为第一个完全跑在“国产算力生态”上的大模型。
4月,中国大模型竞技场上依然会很热闹。除了备受瞩目的DeepSeek,我们从腾讯内部了解到,作为腾讯首席AI科学家姚顺雨也将发布混元新模型(30B参数级别)。
姚顺雨在去年12月官宣正式加入腾讯后,一直忙于模型和产品的开发。据悉,早在去年年初姚顺雨就接受邀请回国,不同于外界所传姚顺雨仅有半年的时间推出新模型,实际上,姚顺雨对新模型的准备早已开始。
而姚顺雨的30B参数模型,在动辄千亿、万亿参数的今天,显得有些“小巧”。不过,这恰恰符合姚顺雨的理念——方法的复杂程度,应该和任务本身的难度相匹配,真正的突破来自于用最优雅的方法解决最复杂的问题。
在腾讯内部,姚顺雨也要求团队成员不要以打榜为导向。
梁文锋和姚顺雨,一位是“全村人都在等着上桌吃饭”的明星创业者,一位是“从硅谷空降回来改造大厂”的95后明星科学家。他们作为备受瞩目的国产大模型核心人物,会怎么影响模型格局,目前尚未可知。
不过,从外部看,两人面临的压力大不相同。
对梁文锋而言,DeepSeek APP的MAU已经超过1亿,但在R1火爆全球之后,大家的期待也被抬到了前所未有的高度。V4的压力正是来源于必须再次成为全世界最出色的开源大模型。
更何况春节前后,豆包、千问、智谱、MiniMax等竞争对手陆续发布新版本,这被视为对DeepSeek的“预防性竞争行为”。从春节一直迟到至今的V4,让市场的焦躁与日俱增。
而对姚顺雨而言,压力则来自于腾讯大模型需要证明自己。
过去两年,腾讯在大模型上的节奏相对谨慎,混元大模型在元宝APP和微信内,长期被作为DeepSeek之外的第二选项存在。姚顺雨也被寄予厚望,他需要帮腾讯AI大模型找到长期表现欠佳的病根,并用实际的产品证明,腾讯拥有后发制人的能力。
压力的另一面也是动力,我们不妨期待4月,国产模型真的能把全球大模型进展再推上一个台阶。
文章来自于“白鲸实验室”,作者 “马舒叶”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/