2天手搓商业级App!开源GLM-5.2+Image2太绝了~【附教程】
2天手搓商业级App!开源GLM-5.2+Image2太绝了~【附教程】大家好,我是袋鼠帝。 如果你家的猫狗真的能说话,它们开口第一句会说什么?
搜索
大家好,我是袋鼠帝。 如果你家的猫狗真的能说话,它们开口第一句会说什么?
最近,Kimi 2.7 Code 和 GLM 5.2 接连发布,一周双发,国产模型又崛起了。
根据OpenRouter最新数据测算,上周(6月8日至14日)全球AI大模型总调用量为44.6万亿Token,较此前一周增长23.5%,连续八周上涨,大模型调用需求仍在持续释放。
这是葬AI起号以来工作量最大的一篇文章。为了严肃评测国产模型的能力,我自研了一个Benchmark,完整测试了智谱、Qwen、Kimi、Minimax、Deepseek这些最新国产模型,还引入了境外势力Claude作对照组。
当智能逼近临界点。
我们在上周五开源了 MiniMax M3 模型权重,同步发布了 MSA(MiniMax Sparse Attention)技术论文。MSA 的架构设计让 M3 在长上下文下的计算成本大幅降低,论文中完整披露了架构与工程实现细节。
每一次技术范式的重大转换,都是旧秩序松动、新物种诞生的窗口期。
文生图的"慢思考",到底有没有用?
在图像到图像翻译(Image-to-Image Translation, I2I)这个任务上,扩散模型过去几年几乎形成了一套默认逻辑:先把输入图像和噪声混合,再一步步去噪,把目标图像 “还原” 出来。
近年来,文生图模型的能力快速提升。从 Stable Diffusion 到 FLUX、Qwen-Image,扩散模型已经能够生成高质量图像,也能处理越来越复杂的文本提示。