AI资讯新闻榜单内容搜索-微调

刚刚，「欧洲的DeepSeek」发布Mistral 3系列模型，全线回归Apache 2.0

刚刚，「欧洲的 DeepSeek」Mistral AI 刚刚发布了新一代的开放模型 Mistral 3 系列模型。该系列有多个模型，具体包括：「世界上最好的小型模型」：Ministral 3（14B、8B、3B），每个模型都发布了基础版、指令微调版和推理版。

来自主题: AI资讯

9416 点击 2025-12-03 08:26

无需重训练+即插即用+性能零损耗，蚂蚁集团×南洋理工首发微调安全框架，让模型既安全又高效

无需重新训练，也能一键恢复模型的安全意识了。

来自主题: AI技术研报

10518 点击 2025-11-19 16:38

NeurIPS 2025 | 上下文元学习实现不微调跨被试脑活动预测

人类高级视觉皮层在个体间存在显著的功能差异，而构建大脑编码模型（brain encoding models）—— 即能够从视觉刺激（如图像）预测人脑神经响应的计算模型 —— 是理解人类视觉系统如何表征世界的关键。传统视觉编码模型通常需要为每个新被试采集大量数据（数千张图像对应的脑活动），成本高昂且难以推广。

来自主题: AI技术研报

11160 点击 2025-11-19 15:21

VinciCoder：多模态统一代码生成框架和视觉反馈强化学习，数据代码模型权重已开源

长期以来，多模态代码生成（Multimodal Code Generation）的训练严重依赖于特定任务的监督微调（SFT）。尽管这种范式在 Chart-to-code 等单一任务上取得了显著成功，但其 “狭隘的训练范围” 从根本上限制了模型的泛化能力，阻碍了通用视觉代码智能（Generalized VIsioN Code Intelligence）的发展。

来自主题: AI技术研报

10259 点击 2025-11-17 14:32

EMNLP2025 | 通研院揭秘MoE可解释性，提升Context忠实性！

在大模型研究领域，做混合专家模型（MoE）的团队很多，但专注机制可解释性（Mechanistic Interpretability）的却寥寥无几 —— 而将二者深度结合，从底层机制理解复杂推理过程的工作，更是凤毛麟角。

来自主题: AI技术研报

10758 点击 2025-11-17 09:25

NeurIPS2025 Spotlight | RobustMerge: 多模态大模型高效微调模型合并的全新范式

在 AI 技术飞速发展的今天，如何高效地将多个专业模型的能力融合到一个通用模型中，是当前大模型应用面临的关键挑战。全量微调领域已经有许多开创性的工作，但是在高效微调领域，尚未有对模型合并范式清晰的指引。

来自主题: AI技术研报

8747 点击 2025-11-10 14:25

RLinf上新πRL：在线强化学习微调π0和π0.5

近年来，基于流匹配的 VLA 模型，特别是 Physical Intelligence 发布的 π0 和 π0.5，已经成为机器人领域备受关注的前沿技术路线。流匹配以极简方式建模多峰分布，能够生成高维且平滑的连续动作序列，在应对复杂操控任务时展现出显著优势。

来自主题: AI技术研报

12081 点击 2025-11-07 10:17

2张4090竟能本地微调万亿参数Kimi K2！趋境联合清华北航把算力门槛击穿了

微调超大参数模型，现在的“打开方式”已经大变样了：仅需2-4 张消费级显卡（4090），就能在本地对DeepSeek 671B乃至Kimi K2 1TB这样的超大模型进行微调了。

来自主题: AI技术研报

9086 点击 2025-11-06 10:52

综述238篇遥感微调！清华院士团队指出9大方向 | CVMJ

在大数据和大模型推动下，微调技术凭借成本低、效率高优势，成为应对小样本、长尾目标等复杂场景的利器。从早期全参数微调到参数高效微调（PEFT），再到如今融合多种PEFT技术的混合微调，遥感微调技术不断进化。清华大学等团队在CVMJ期刊上系统梳理了技术脉络，并指出了九个潜在研究方向，助力遥感技术在农业监测、天气预报等关键领域发挥更大作用。

来自主题: AI资讯

10109 点击 2025-11-03 10:31

苹果提出新型反向传播：一台iPhone 15 Pro Max就能微调LLM

用 iPhone 本地跑大模型已经不是新鲜事了，但能不能在 iPhone 上微调模型呢？

来自主题: AI技术研报

10523 点击 2025-10-30 17:27