DeepSeek崩上热搜!
宕机持续超过8小时,写论文的、角色扮演的和心情不好找AI吐槽的人也都崩溃了。
But!这不是一次普通的服务中断,反而被解读为模型升级的前兆。

就在宕机前,很多用户报告DeepSeek网页版它变了,模型能力大幅提升。
比如经典的用SVG画鹈鹕骑自行车任务,3月29日的DeepSeek,构图和色彩都明显比一周前强。

而且DeepSeek这家公司,不预告、不公告,瞧瞧静默升级模型,已经不是第一次了。
模型到底有没有真的升级,答案就藏在对话记录里。
首先是身份标识更新,3月29日的版本会稳定的介绍自己为DeepSeek-V3模型。
一周前,同样的问题,它的自我介绍还是模糊的“我是DeepSeek,一款纯文字AI助手……“,对自己的版本号只字不提。

如果说这种变化也可能是偶然,那么知识截止日期的变化更有说服力。
在不开启联网搜搜的情况下,现在它知道25年的美国选举结果。但不知道26年2月的大事,有人据此推测新版本的知识截止日期可能是26年1月。

最后,3月29日DeepSeek一次性写代码生成前端页面的效果也有大幅提高。

所以到底是微调后的V3,还是直接升级了V4?
DeepSeek官方一个字都没说。
目前DeepSeek网页版已恢复服务。
不过还是有点小问题,开启深度思考模式的话,模型在思考结束后就会停止输出,并不会把答案输出在正文里。

不开深度思考模式的话,从模型自我介绍看似乎已恢复成老版本。

总之,结合DeepSeek上周一口气开启17个岗位,大招Agent方向人才来看:
在龙虾时代沉默了好久的DeepSeek,似乎在憋个大的。

参考链接:
[1]https://x.com/marmaduke091/status/2038211313566965823?s=20
[2]https://x.com/AiBattle_/status/2038206244016537615?s=20
文章来自于微信公众号 "量子位",作者 "量子位"
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner