AI资讯新闻榜单内容搜索-微调

10人明星团队炼出首个微调Llama 3.1 405B！角色扮演一秒入戏，代码全开源

发布40天后，最强开源模型Llama 3.1 405B等来了微调版本的发布。但不是来自Meta，而是一个专注于开放模型的神秘初创Nous Research。

来自主题: AI技术研报

7561 点击 2024-08-16 14:49

智谱AI把自研打造的大模型给开源了。

来自主题: AI资讯

8120 点击 2024-08-07 11:16

在本篇文章中，笔者将讨论以下几个问题： • 向量模型在 RAG 系统中的作用有哪些性能不错的向量模型（从 RAG 角度）不同向量模型的评测基准 MTEB 业务中选择向量模型有哪些考量如何 Finetune 向量模型

来自主题: AI技术研报

14482 点击 2024-08-03 10:44

为了解决这个问题，一些研究尝试通过强大的 Teacher Model 生成训练数据，来增强 Student Model 在特定任务上的性能。然而，这种方法在成本、可扩展性和法律合规性方面仍面临诸多挑战。在无法持续获得高质量人类监督信号的情况下，如何持续迭代模型的能力，成为了亟待解决的问题。

来自主题: AI技术研报

7891 点击 2024-08-01 15:55

UrbanGPT是一种创新的时空大型语言模型，它通过结合时空依赖编码器和指令微调技术，展现出在多种城市任务中卓越的泛化能力和预测精度。这项技术突破了传统模型对大量标记数据的依赖，即使在数据稀缺的情况下也能提供准确的预测，为城市管理和规划提供了强大的支持。

来自主题: AI技术研报

11575 点击 2024-07-31 16:37

适逢Llama 3.1模型刚刚发布，英伟达就发表了一篇技术博客，手把手教你如何好好利用这个强大的开源模型，为领域模型或RAG系统的微调生成合成数据。

来自主题: AI技术研报

11860 点击 2024-07-29 20:20

华盛顿大学和Allen AI最近发表的论文提出了一种新颖有趣的数据合成方法。他们发现，充分利用LLM的自回归特性，可以引导模型自动生成高质量的指令微调数据。

来自主题: AI资讯

7492 点击 2024-07-26 17:27

Llama 3.1 405B巨兽开源的同时，OpenAI又抢了一波风头。从现在起，每天200万训练token免费微调模型，截止到9月23日。

来自主题: AI资讯

5964 点击 2024-07-26 17:20

刚刚，GPT-4o mini版迎来“高光时刻”——

来自主题: AI资讯

10120 点击 2024-07-24 20:21

低秩适应（Low-Rank Adaptation，LoRA）通过可插拔的低秩矩阵更新密集神经网络层，是当前参数高效微调范式中表现最佳的方法之一。此外，它在跨任务泛化和隐私保护方面具有显著优势。

来自主题: AI技术研报

13180 点击 2024-07-21 14:02