仅需格式转换提升9%数学推理能力,上交开源新对齐方法ReAlign
仅需格式转换提升9%数学推理能力,上交开源新对齐方法ReAlign大模型对齐新方法,让数学推理能力直接提升9%。
来自主题: AI技术研报
5922 点击 2024-03-13 11:10
大模型对齐新方法,让数学推理能力直接提升9%。
教大模型调用工具,已经是AI圈关注度最高的话题之一了。这不,又有一项研究登上最新NeurIPS 2023——它是一个叫做Chameleon(变色龙)的框架,号称能将大语言模型直接变成魔法师的工具箱,来自微软与加州大学洛杉矶分校(UCLA)。
UCLA等机构研发的Chameleon框架,在AI界引起广泛关注,获得超过100次学术引用,AlphaSignal评选其为「周最佳论文」。
大型多模态模型会做数学题吗?在UCLA等机构最新发布的MathVista基准上,即使是当前最强的GPT-4V也会感到「挫败感」。
专门为AI设立的IMO国际奥林匹克数学竞赛来了—
今天,智谱AI开源其第三代基座大语言模型ChatGLM3-6B,官方说明该模型的性能较前一代大幅提升,是10B以下最强基础大模型!
阿里目前再次开源全新的Qwen-14B的模型,参数规模142亿,但是它的理解能力接近700亿参数规模的LLaMA2-70B,数学推理能力超过GPT-3.5。