AI资讯新闻榜单内容搜索-大模型微调

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 大模型微调

大模型微调范式认知再被颠覆？UIUC、Amazon团队最新研究指出SFT灾难性遗忘问题或被误解

大模型微调范式认知再被颠覆？UIUC、Amazon团队最新研究指出SFT灾难性遗忘问题或被误解

大模型微调范式认知再被颠覆？UIUC、Amazon团队最新研究指出SFT灾难性遗忘问题或被误解

在大模型微调实践中，SFT（监督微调）几乎成为主流流程的一部分，被广泛应用于各类下游任务和专用场景。比如，在医疗领域，研究人员往往会用领域专属数据对大模型进行微调，从而显著提升模型在该领域特定任务上的表现。

来自主题: AI技术研报

7552 点击 2025-10-24 10:13

Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降，要重新发明一个OpenAI

Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降，要重新发明一个OpenAI

Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降，要重新发明一个OpenAI

Thinking Machines Lab发布首个产品：Thinker，让模型微调变得像改Python代码一样简单。也算是终于摘掉了“0产品0收入估值840亿”的帽子。Tinker受到了业界的密切关注。AI基础设施公司Anyscale的CEO Robert Nishihara等beta测试者表示，尽管市面上有其他微调工具，但Tinker在“抽象化和可调性之间取得了卓越的平衡”

来自主题: AI资讯

9788 点击 2025-10-03 11:53

同时监督和强化的单阶段大模型微调，告别“先背书再刷题”，推理泛化双提升｜中科院&美团等

同时监督和强化的单阶段大模型微调，告别“先背书再刷题”，推理泛化双提升｜中科院&美团等

同时监督和强化的单阶段大模型微调，告别“先背书再刷题”，推理泛化双提升｜中科院&美团等

通过单阶段监督微调与强化微调结合，让大模型在训练时能同时利用专家演示和自我探索试错，有效提升大模型推理性能。

来自主题: AI技术研报

7366 点击 2025-07-02 15:35

3步轻松微调Qwen3，本地电脑就能搞，这个方案可以封神了！【喂饭级教程】

3步轻松微调Qwen3，本地电脑就能搞，这个方案可以封神了！【喂饭级教程】

3步轻松微调Qwen3，本地电脑就能搞，这个方案可以封神了！【喂饭级教程】

大家好，我是袋鼠帝今天给大家带来的是一个带WebUI，无需代码的超简单的本地大模型微调方案（界面操作），实测微调之后的效果也是非常不错。

来自主题: AI技术研报

9133 点击 2025-05-27 13:38

缺钱缺数据时的大模型微调方法汇总

缺钱缺数据时的大模型微调方法汇总

缺钱缺数据时的大模型微调方法汇总

别说什么“没数据就去标注啊，没钱标注就别做大模型啊”这种风凉话，有些人数据不足也能做大模型，是因为有野心，就能想出来稀缺数据场景下的大模型解决方案，或者整理出本文将要介绍的 "Practical Guide to Fine-tuning with Limited Data" 这样的综述。

来自主题: AI资讯

10376 点击 2024-12-09 09:30

金融研报数据魔改Yi-34B & DeepSeek 67B 谁更强？ Deepmoney金融大模型魔改方案分享&在线实测

金融研报数据魔改Yi-34B & DeepSeek 67B 谁更强？ Deepmoney金融大模型魔改方案分享&在线实测

金融研报数据魔改Yi-34B & DeepSeek 67B 谁更强？ Deepmoney金融大模型魔改方案分享&在线实测

在微调大型模型的过程中，一个常用的策略是“知识蒸馏”，这意味着借助高性能模型，如GPT-4，来优化性能较低的开源模型。这种方法背后隐含的哲学理念与logos中心论相似，把GPT-4等模型视为更接近唯一的逻辑或真理的存在。

来自主题: AI资讯

8421 点击 2024-02-21 16:49

大模型微调非得依赖人类数据吗？DeepMind：用带反馈的自训练更好

大模型微调非得依赖人类数据吗？DeepMind：用带反馈的自训练更好

大模型微调非得依赖人类数据吗？DeepMind：用带反馈的自训练更好

面对当前微调大模型主要依赖人类生成数据的普遍做法，谷歌 DeepMind 探索出了一种减少这种依赖的更高效方法。

来自主题: AI资讯

9706 点击 2023-12-26 15:02

上一页当前第1页,共1页下一页