AI资讯新闻榜单内容搜索-训练

史上首个100%开源大模型重磅登场！破纪录公开代码/权重/数据集/训练全过程，AMD都能训

艾伦人工智能研究所等5机构最近公布了史上最全的开源模型「OLMo」，公开了模型的模型权重、完整训练代码、数据集和训练过程，为以后开源社区的工作设立了新的标杆。

来自主题: AI技术研报

8514 点击 2024-02-03 14:45

有的大模型对齐方法包括基于示例的监督微调（SFT）和基于分数反馈的强化学习（RLHF）。然而，分数只能反应当前回复的好坏程度，并不能明确指出模型的不足之处。相较之下，我们人类通常是从语言反馈中学习并调整自己的行为模式。

来自主题: AI技术研报

7020 点击 2024-02-03 12:52

一直以来，让 AI 成为手机操作助手都是一项颇具挑战性的任务。在该场景下，AI 需要根据用户的要求自动操作手机，逐步完成任务。

来自主题: AI技术研报

9996 点击 2024-02-03 12:44

将不同的基模型象征为不同品种的狗，其中相同的「狗形指纹」表明它们源自同一个基模型。

来自主题: AI技术研报

6979 点击 2024-02-02 18:11

来自UCLA的华人团队提出一种全新的LLM自我对弈系统，能够让LLM自我合成数据，自我微调提升性能，甚至超过了用GPT-4作为专家模型指导的效果。

来自主题: AI技术研报

7754 点击 2024-02-02 17:27

只需一张照片，整个过程无需训练 LoRA 模型，多风格 AI 写真即刻呈现！

来自主题: AI资讯

9227 点击 2024-02-02 11:52

过去几个月中，随着 GPT-4V、DALL-E 3、Gemini 等重磅工作的相继推出，「AGI 的下一步」—— 多模态生成大模型迅速成为全球学者瞩目的焦点。

来自主题: AI技术研报

8835 点击 2024-02-02 11:39

AI大模型在业界备受关注，但对于一些公司来说，采用小模型可能是一种更好的选择。微软已经开始研发小规模、低算力需求的模型，并组建新团队进行对话式AI的开发。而对于工业、金融和汽车等领域而言，小模型更易于落地，并且具有省电、省钱、省时间的优势。

来自主题: AI资讯

3553 点击 2024-02-01 22:49

对于大型视觉语言模型（LVLM）而言，扩展模型可以有效提高模型性能。然而，扩大参数规模会显著增加训练和推理成本，因为计算中每个 token 都会激活所有模型参数。

来自主题: AI技术研报

8456 点击 2024-01-31 16:23

生成式AI技术发展的背后，反映出人类与大模型交互的不断精进。大模型在训练过程中不断学习人类的思考方式，人类在与大模型的对话中也收获了灵感和新知。

来自主题: AI资讯

7440 点击 2024-01-31 11:31