AI资讯新闻榜单内容搜索-模型权重

Kimi K3竟是GPT-2的22580倍，博主「肝」48小时发现：七年进化大模型不只是参数暴涨

最近，月之暗面 kimi 正式开源 Kimi K3 完整模型权重，Kimi K3 是一款总参数量达 2.8 万亿、上下文窗口达 100 万 token 的 MoE 大模型，更是全球首个落地的近 3 万亿参数级开源大模型，引起业界热议。

来自主题: AI技术研报

9186 点击 2026-07-29 14:23

刚刚，Kimi K3正式开源！3万亿模型权重全球开放（附开源地址）

就在刚刚，全球首个3万亿参数级开源模型Kimi K3正式开源！https://github.com/MoonshotAI/Kimi-K3/tree/main。Moonshot AI宣布，发布Kimi K3的模型权重、技术报告，并开源支撑Kimi K3模型训练的关键Infra技术：MoonEP、FlashKDA和AgentEnv。

来自主题: AI资讯

7266 点击 2026-07-28 01:18

港科大新发现：MoE路由很脆弱！重复token输入阻塞负载均衡 | ICML'26

来自港科大的研究团队提出了RepetitionCurse，这是一种针对MoE大模型服务的黑盒压力测试方法。它不需要模型权重，不需要梯度，也不需要知道后端专家如何部署，只利用高度重复的输入模式，就能诱导专家路由把大量token路由到同一小批专家上。

来自主题: AI技术研报

9235 点击 2026-07-19 10:11

我们开源了 MiniMax M3

我们在上周五开源了 MiniMax M3 模型权重，同步发布了 MSA（MiniMax Sparse Attention）技术论文。MSA 的架构设计让 M3 在长上下文下的计算成本大幅降低，论文中完整披露了架构与工程实现细节。

来自主题: AI资讯

9098 点击 2026-06-16 10:34

把大模型，压缩到 200MB 内存：面壁智能的新模型，手表也够跑

刚刚的，面壁智能联合 OpenBMB 搞了个端侧开源周。今天作为开源周的第一天，端出来的是个好东西 BitCPM-CANN，模型权重只需要约 200 MB 的内存，手表也够跑

来自主题: AI技术研报

7653 点击 2026-05-25 14:44

中国 AI 公司，该怎么「抄 Claude Code 的作业」？

一次低级失误，让全球开发者拿到了 AI 编程工具的「行业标准答案」。一个更重要的问题是，AI 公司，应该如何利用这次「泄露」，抄作业？很多人第一反应是：Claude Code 不就是一个套了模型 API 的命令行工具吗？源代码泄露了又怎样，没有模型权重，这些代码不过是个「壳子」。

来自主题: AI资讯

6871 点击 2026-04-01 17:05

只靠国产算力预训练，稳！全流程开源，「开元」盛世真来了

鹏城实验室与清华大学PACMAN实验室联合发布了鹏城脑海‑2.1‑开元‑2B（PCMind‑2.1‑Kaiyuan‑2B，简称开元‑2B）模型，并以全流程开源的方式回应了这一挑战——从训练数据、数据处理框架、训练框架、完整技术报告到最终模型权重，全部开源。

来自主题: AI技术研报

9496 点击 2025-12-21 12:38

AAAI 2026 | 首个抗端到端攻击的大模型加密指纹 / 水印方案

随着大语言模型（LLM）的商业价值快速提升，其昂贵的训练成本使得模型版权保护（IP Protection）成为业界关注的焦点。然而，现有模型版权验证手段（如模型指纹）往往忽略一个关键威胁：攻击者一旦直接窃取模型权重，即拥有对模型的完全控制权，能够逆向指纹 / 水印，或通过修改输出内容绕过指纹验证。

来自主题: AI技术研报

9622 点击 2025-12-02 10:20

VinciCoder：多模态统一代码生成框架和视觉反馈强化学习，数据代码模型权重已开源

长期以来，多模态代码生成（Multimodal Code Generation）的训练严重依赖于特定任务的监督微调（SFT）。尽管这种范式在 Chart-to-code 等单一任务上取得了显著成功，但其 “狭隘的训练范围” 从根本上限制了模型的泛化能力，阻碍了通用视觉代码智能（Generalized VIsioN Code Intelligence）的发展。

来自主题: AI技术研报

10278 点击 2025-11-17 14:32

让你的Mac用上DeepSeek-OCR：一个从0到1的开源适配之旅

DeepSeek-OCR这段时间非常火，但官方开源的文件是“按 NVIDIA/CUDA 习惯写的 Linux 版推理脚本+模型权重”，而不是“跨设备跨后端”的通吃实现，因此无法直接在苹果设备上运行，对于Mac用户来说，在许多新模型诞生的第一时间，往往只能望“模”兴叹。

来自主题: AI技术研报

9871 点击 2025-10-29 17:10