AI资讯新闻榜单内容搜索-LLM

用LaTRO框架，通过自我奖励机制来激发LLM潜在推理能力，基准上提升12.5% |Salesforce重磅

大规模语言模型（LLMs）已经在自然语言处理任务中展现了卓越的能力，但它们在复杂推理任务上依旧面临挑战。推理任务通常需要模型具有跨越多个步骤的推理能力，这超出了LLMs在传统训练阶段的表现。

来自主题: AI资讯

8514 点击 2024-11-15 10:34

自一致性首选项优化SCPO，让LLM多次回答同一个问题，选输出频率最高的答案 |Meta最新

传统的训练方法通常依赖于大量人工标注的数据和外部奖励模型，这些方法往往受到成本、质量控制和泛化能力的限制。因此，如何减少对人工标注的依赖，并提高模型在复杂推理任务中的表现，成为了当前的主要挑战之一。

来自主题: AI技术研报

8944 点击 2024-11-14 14:42

国产地表最强视频模型震惊歪果仁，官方现场摇人30s直出！视觉模型进入上下文时代

全球首个支持多主体一致性的多模态模型，刚刚诞生！Vidu 1.5一上线，全网网友都震惊了：LLM独有的上下文学习优势，视觉模型居然也有了。

来自主题: AI资讯

8250 点击 2024-11-14 14:36

1000多个智能体组成，AI社会模拟器MATRIX-Gen助力大模型自我进化

随着大语言模型（LLMs）在处理复杂任务中的广泛应用，高质量数据的获取变得尤为关键。为了确保模型能够准确理解并执行用户指令，模型必须依赖大量真实且多样化的数据进行后训练。然而，获取此类数据往往伴随着高昂的成本和数据稀缺性。因此，如何有效生成能够反映现实需求的高质量合成数据，成为了当前亟需解决的核心挑战。

来自主题: AI技术研报

8510 点击 2024-11-14 14:07