AI资讯新闻榜单内容搜索-大模型

打破代码大模型训练瓶颈：微软&剑桥&普林推出MicroCoder，算法、数据、框架、训练经验全面升级

新一代代码模型的训练动态已与旧模型截然不同，主流强化学习方法和数据集在其上几乎“失效”。

来自主题: AI技术研报

10640 点击 2026-03-30 09:29

智普GLM5.1重磅上线！2000万Tokens免费送，先到先得

国产大模型阵营再添硬核选手，智谱开放平台GLM5.1正式上线，推理、代码、智能体能力拉满，还为新用户准备了2000万Tokens免费体验包，覆盖多模型使用额度，有效期3个月。不管是日常编程开发、智能体搭建，还是多模态内容创作，这个免费额度都能轻松拿捏，新手也能零门槛上手，这波福利可别错过。

来自主题: AI资讯

17526 点击 2026-03-29 00:21

刚刚，一口气连发3个王炸模型、亮出2026年AGI战略，昆仑万维夯爆了

在会上，昆仑万维旗下天工 AI 重磅发布了全新 AI 游戏世界模型 Matrix-Game 3.0、AI 视频大模型 SkyReels V4 和 AI 音乐大模型 Mureka V9，在继续强化 AIGC 理解与生成能力的同时，进一步推进 AI 对物理世界的建模与仿真。

来自主题: AI资讯

10485 点击 2026-03-27 23:27

刚刚，Anthropic王炸Claude泄露！全面碾压Opus 4.6引爆全网

刚刚，《财富》独家爆出——由于一次罕见的「人为配置」错误，最强大模型「Claude Mythos」绝密细节公之于众。Claude Mythos代号「Capybara」，代表最高「层级」，是一款具有划时代意义的全新模型。

来自主题: AI资讯

10461 点击 2026-03-27 18:28

刚刚，全球最难考试惊天大反转！AI黑马 Symbolica冲破36%，顶流模型集体翻车

就在昨天，ARC-AGI-3刚把全球顶尖大模型按在地上摩擦，结果一家名不见经传的公司却给出惊天消息：他们的AI在首日就取得了36.08%的成绩！这匹黑马究竟靠什么撕开全球最难AI考试的铁幕？是真突破，还是另有玄机？

来自主题: AI资讯

9599 点击 2026-03-27 15:24

林俊旸离职后首发文：我们为什么没把“思考+指令”合并好？

昨日晚间，前阿里千问大模型负责人林俊旸（Junyang Lin）在社交平台X上发表了《从“推理式思考”到“智能体式思考”（From "Reasoning" Thinking to "Agentic" Thinking）》的长文，引起AI技术产业圈关注。

来自主题: AI资讯

10571 点击 2026-03-27 13:41

全球顶尖大模型一夜惨遭血洗！最难AI测试人类拿满分，AI第一名得0.2%分

今夜，整个AI圈震动了。全球最难AGI测试ARC-AGI-3一上线，就把全球顶尖AI打到集体失声，人类满分通关，最强模型Opus 4.6得分仅0.2%，还不到1%。AI这是一夜被打回「原始人」了。

来自主题: AI资讯

8554 点击 2026-03-27 00:39

用SFT打出RL的效果？微软联合提出高效后训练算法

在大模型后训练阶段，监督微调（SFT）和强化学习（RL）是两根不可或缺的支柱。SFT 利用高质量的离线（Off-policy）数据快速注入知识，但受限于静态数据分布，泛化能力往往容易触及天花板并带来灾难性遗忘；RL 则允许模型在探索中不断自我迭代，产生与当前策略同分布（On-policy）的数据，上限极高，但往往伴随着训练极度不稳定、计算资源消耗巨大的痛点。

来自主题: AI技术研报

6196 点击 2026-03-26 10:47

Sand.ai开源发布MagiCompiler：突破局部编译界限，定义训推性能上限

大模型开发者常面临一个两难选择：要速度，还是省显存？

来自主题: AI技术研报

7045 点击 2026-03-25 14:17

对抗KV Cache压缩的脆弱性：两行代码以最坏风险控制防御底层假设崩塌

随着大模型长上下文能力快速增长，海量 KV Cache 存储需求急剧增加，各类 KV Cache 压缩方法如雨后春笋般涌现。然而，这些方案在真实场景中的工程落地却常常陷入困境。

来自主题: AI技术研报

9542 点击 2026-03-25 13:41