AI资讯新闻榜单内容搜索-语言模型

百万鲁棒数据训练，3D场景大语言模型新SOTA！IIT等发布Robin3D

Robin3D通过鲁棒指令数据生成引擎（RIG）生成的大规模数据进行训练，以提高模型在3D场景理解中的鲁棒性和泛化能力，在多个3D多模态学习基准测试中取得了优异的性能，超越了以往的方法，且无需针对特定任务的微调。

来自主题: AI技术研报

7654 点击 2024-10-15 14:39

苹果多模态模型大升级！文本密集、多图理解，全能小钢炮

多模态大语言模型（MLLM）如今已是大势所趋。过去的一年中，闭源阵营的GPT-4o、GPT-4V、Gemini-1.5和Claude-3.5等模型引领了时代。

来自主题: AI资讯

5103 点击 2024-10-14 09:50

苹果发文质疑：大语言模型根本无法进行逻辑推理

5 大证据显示，LLM 在推理复杂问题时非常脆弱。

来自主题: AI资讯

4224 点击 2024-10-14 09:16

NeurIPS 2024 | 大模型的词表大小，同样适用于Scaling Law

本文是一篇发表在 NeurIPS 2024 上的论文，单位是香港大学、Sea AI Lab、Contextual AI 和俄亥俄州立大学。论文主要探讨了大型语言模型（LLMs）的词表大小对模型性能的影响。

来自主题: AI技术研报

7455 点击 2024-10-11 13:55

RAG测评关键指标

RAG（Retrieval-Augmented Generation）是一种结合信息检索与文本生成的技术，旨在提高大型语言模型（LLM）在回答复杂查询时的表现。它通过检索相关的上下文信息来增强生成答案的质量和准确性。解读RAG测评：关键指标与应用分析

来自主题: AI资讯

5482 点击 2024-10-11 10:06

NeurIPS 2024｜SparseLLM：突破性全局剪枝技术，大语言模型稀疏化革命

该研究主要探讨了大语言模型的全局剪枝方法，旨在提高预训练语言模型的效率。该成果的发表为大模型的剪枝与优化研究提供了新的视角，并在相关领域具有重要的应用潜力。

来自主题: AI技术研报

5753 点击 2024-10-10 17:17

综合RLHF、DPO、KTO优势，统一对齐框架UNA来了

随着大规模语言模型的快速发展，如 GPT、Claude 等，LLM 通过预训练海量的文本数据展现了惊人的语言生成能力。然而，即便如此，LLM 仍然存在生成不当或偏离预期的结果。这种现象在推理过程中尤为突出，常常导致不准确、不符合语境或不合伦理的回答。为了解决这一问题，学术界和工业界提出了一系列对齐（Alignment）技术，旨在优化模型的输出，使其更加符合人类的价值观和期望。

来自主题: AI技术研报

9229 点击 2024-10-10 12:21