美团又上新模型,8个Thinker齐开工,能顶个诸葛亮?
美团又上新模型,8个Thinker齐开工,能顶个诸葛亮?美团也重磅更新自家模型 ——LongCat-Flash-Thinking-2601。这是一款强大高效的大规模推理模型,拥有 5600 亿个参数,基于创新的 MoE 架构构建。该模型引入了强大的重思考模式(Heavy Thinking Mode),能够同时启动 8 路思考并最终总结出一个更全面、更可靠的结论。目前重思考模式已在 LongCat AI 平台正式上线,人人均可体验。
美团也重磅更新自家模型 ——LongCat-Flash-Thinking-2601。这是一款强大高效的大规模推理模型,拥有 5600 亿个参数,基于创新的 MoE 架构构建。该模型引入了强大的重思考模式(Heavy Thinking Mode),能够同时启动 8 路思考并最终总结出一个更全面、更可靠的结论。目前重思考模式已在 LongCat AI 平台正式上线,人人均可体验。
今天我们来聊聊:480 万人看过的 Claude Code 方法论。这篇文章的作者叫 Eyad。从履历看,是典型的技术老兵:在 Amazon、Disney、Capital One 这样的巨头公司做过 7 年工程,参与过面向百万级用户的系统开发。现在,他是初创公司 Varickai 的 CTO。
MemGovern团队 投稿 量子位 | 公众号 QbitAI 人类程序员碰到棘手bug通常会上网查询前辈经验。 当前AI虽然开始具备联网搜索能力,但仍不能很好地从网络经验中获取修复bug的能力。 让
Michael Truell让Cursor中的GPT-5.2连续运行了整整一周。不是一小时,不是一天,而是不眠不休,昼夜不停,168小时持续写代码。结果?300万行代码。数千个文件。
今天,OpenAI与美国AI芯片独角兽Cerebras联合宣布,将部署750兆瓦的Cerebras晶圆级系统,为OpenAI客户提供服务。该合作将于2026年起分阶段落地,并于2028年之前完成,建成后将成为全球规模最大的高速AI推理平台。
RAG与agent用到深水区,一定会遇到这个问题: 明明架构很完美,私有数据也做了接入,但项目上线三天,不但token账单爆了,模型输出结果也似乎总差点意思。
“AI Infra 就是云计算本身。”
提高大模型记忆这块儿,美国大模型开源王者——英伟达也出招了。
我结合AI做了一次A股、美股、港股所有AI概念公司的分析总结,践行“用AI扫描AI板块”。今天分享一部分内容:股价涨幅、估值水平、盈利能力、三个市场投资人有哪些共识点。
今天,首个在国产芯片上完成全程训练的SOTA(最佳水平)多模态模型开源。这是智谱联合华为开源的图像生成模型GLM-Image。从数据到训练的全流程,该模型完全基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成构建。