最近,国产模型开源非常多。
MiniMax、Kimi、Qwen、混元、智谱、昆仑万维等等,都在疯狂开源。
有一个非常有意思的变化。
海外疯狂涨价、国内疯狂开源。
这个世界,好像真的变天了。
然后,昨天,我照例打开了hugging Face。
就在榜单上看到了这么一幕。
我甚至以为我眼睛花了,揉了一下,再看,确实还是这10个。。。
前10名的模型,全部都是中国的,开源模型。
智谱GLM-4.5登顶,Air排名第6;Qwen一家独占5席位,开源世界半壁江山;混元3D世界模型作为唯二的多模态,排行第3。
今夕是何年,天地翻覆不过顷刻间。
不到两年时间,咱们亲眼目睹了一个时代的逆转。
我本来想给大家盘点一下,这10个开源模型的能力和介绍。
但是我一想,最近其实国内已经卷疯了,除了这些在榜上的,还有一些大家不知道的优秀的开源项目。
那不如,就做一下,最近这一整个月的盘点吧,给大家看看,国产的开源力量。
有这个想法之后,于是,我就去找了我的好朋友,也是一个非常硬核的AI技术博主,刘聪NLP,因为我知道他一直都有盯着开源世界的习惯。
没想到,他还真的整理了一份。
所以,这篇文章里的很多的模型盘点,都来自刘聪NLP,没啥可说的,感谢聪哥。
NLP刘聪,一点都不普通。
接下来,让我们开始。
- 6月27号,腾讯开源了混元A13B模型。
总参数80B,激活参数13B,补齐了70-80B尺寸的空缺。
- 6月30日,百度ERNIE4.5正式开源。
百度信守了承诺。有纯LLM还有多模态,尺寸也蛮全的,大小都有。
- 7月1日,阿里通义开源首个CoT音频模型-ThinkSound。
主要用于视频配音,让每一帧画面都有专属匹配音效。
- 7月2号,智谱开源GLM-4.1V-Thinking模型。
刘聪也第一时间做了评测:服了!没想到,GLM-4.1V-Thinking竟然把这些问题都答对了!9B尺寸的视觉理解模型有点强。
- 7月4日,昆仑万维开源奖励模型Skywork-Reward-V2 系列。
共包含 8 个基于不同基座模型和不同大小的奖励模型,参数规模从 6 亿到 80 亿不等。
- 7月5号,邱锡鹏老师团队开源MOSS-TTSD。
基于百万小时音频训练,不过好久没听到MOSS了。
- 7月8号,蚂蚁集团知识引擎团队开源KAG-Thinker 模型。
一种交互式思维与深度推理模型,为复杂的多跳问题提供认知推理范式。不过这个关注度不高,但是你这个readme都不写吗= =
- 7月9日,昆仑万维开源Skywork-R1V3模型。
也是一个多模态理解模型,基于InternVL-38B进行特殊的Post-Training得到的效果更好地模型。
- 7月11日,Kimi开源K2模型。
有基础模型 Kimi-K2-Base 与 微调模型 Kimi-K2-Instruct两个版本,当时仅20min就达到近12.2k的下载量。
K2真是好评不断,也是提升了大家对国内大模型的真实Coding能力的信心。
- 7月21日,阿里Qwen开源Qwen3-235B-A22B-Instruct-2507模型,当前排名第10。
之后就连续开源。
- 7月22日开源Qwen3-Coder-480B-A35B-Instruct,当前排名第2。
- 7月25日开源Qwen3-235B-A22B-Thinking-2507,当前排名第5。
- 7月26日,上海人工智能实验室开源书生科学多模态大模型Intern-S1。
一个241B多模态混合推理模型。
- 7月27日,腾讯混元开源了3D世界模型1.0-HunyuanWorld-1。
也是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型,为游戏开发、VR、数字内容创作等领域带来了全新的可能性。腾讯还在3D上发力。也是现在排名第3的模型。
- 7月28日,阿里通义万相团队开源Wan2.2。
是业界首个使用MoE架构的视频生成基础模型,有文生视频Wan2.2-T2V-A14B、图生视频Wan2.2-I2V-A14B、统一视频生成Wan2.2-TI2V-5B。当前排名第9。
- 7月28号,智谱开源GLM-4.5系列模型。
包括:GLM-4.5 355B-A32B、GLM-4.5-Air 106B-A12B,这几天社区反响很好,也是冲到了HF热榜第1,登顶。
- 7月30日,Qwen开源Qwen3-30B-A3B-Instruct-2507。
亲民版模型,本地部署福音。Qwen开源了亲民版模型!这次是30B-A3B小尺寸!当前第7。
- 7月30日,昆仑万维开源多模态统一模型Skywork-UniPic-1.5B。
实现图像理解、文本到图像生成、图像编辑三大核心能力。
- 7月31日,Qwen继续开源Qwen3-30B-A3B-Thinking-2507模型。
- 7月31日,阶跃要开源Step3模型。
不过没等到,先放个官方声明吧。
因为都是我和刘聪手动整理,也许会漏掉一些,勿怪!!
可以直接在评论区补充,但仅限最近一个月的国内开源哈~
最后。
我忽然有点想起了23年的世界,那时候,中文世界只有GLM这一个独苗,海外开源模型层出不穷,我至今还记得当年LLaMa2的震撼。
那时候,我们用着国外的模型,小心翼翼地去改他们的Prompt,适配我们的场景。
那时候,我们顶着质疑,熬着通宵,费尽全力也只能追在别人屁股后面跑。
那时候,我们羡慕着硅谷的光芒,幻想着有一天也能创造属于我们自己的传奇。
短短两年之后的今天,我们却第一次真切地站在世界开源舞台的中央。
这条路,走得太难,太辛苦,太漫长。
但好在,我们从未停下脚步。
想起海外模型不断闭源,不断涨价,甚至Anthropic开始限制Claude访问量,默默降低次数。
大洋这边,还在不断开源,为这个世界的AI生态,不断做着贡献。
如果一定要问,今夕是何年?
那我觉得,一定是属于国产大模型的元年。
也是属于中文世界的开源元年。
文章来自公众号“数字生命卡兹克”,作者“卡兹克、刘聪NLP”
【开源免费】kimi-free-api是一个提供长文本大模型逆向API的开渔免费技术。它支持高速流式输出、智能体对话、联网搜索、长文档解读、图像OCR、多轮对话,零配置部署,多路token支持,自动清理会话痕迹等原大模型支持的相关功能。
项目地址:https://github.com/LLM-Red-Team/kimi-free-api?tab=readme-ov-file
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales