AI资讯新闻榜单内容搜索-语言模型

大模型也冲“奥斯卡”：港科大腾讯等提出AI角色扮演全景综述，四方面剖析关键细节

AI界也有了自己的“奥斯卡”，哪家大模型角色扮演更入戏？来自香港科技大学、腾讯、新加坡管理大学的团队提出新综述—— 不仅系统性地回顾了角色扮演语言模型的发展历程，还对每个阶段的关键进展进行了深入剖析，展示了这些进展如何推动模型逐步实现更复杂、更逼真的角色扮演。

来自主题: AI技术研报

5915 点击 2024-11-03 14:39

多图场景用DPO对齐！上海AI实验室等提出新方法，无需人工标注

多图像场景也能用DPO方法来对齐了！由上海交大、上海AI实验室、港中文等带来最新成果MIA-DPO。这是一个面向大型视觉语言模型的多图像增强的偏好对齐方法。

来自主题: AI技术研报

5117 点击 2024-11-01 20:53

打破RLHF瓶颈，克服奖励欺骗！Meta发布全新后训练方式CGPO，编程水平直升5%

CGPO框架通过混合评审机制和约束优化器，有效解决了RLHF在多任务学习中的奖励欺骗和多目标优化问题，显著提升了语言模型在多任务环境中的表现。CGPO的设计为未来多任务学习提供了新的优化路径，有望进一步提升大型语言模型的效能和稳定性。

来自主题: AI技术研报

4221 点击 2024-11-01 14:54

AI自己「长出」了类似大脑的「脑叶」？新研究揭示LLM特征的惊人几何结构

大型语言模型在学习概念时竟然会形成令人惊讶的几何结构，比如代码和数学特征会形成一个「叶（lobe）」，类似于我们在做磁共振功能成像时看到的大脑功能性脑叶。这说明什么呢？

来自主题: AI资讯

6805 点击 2024-11-01 13:01

Ferret-UI 2：苹果最新跨平台通用GUI理解多模态大模型

Ferret-UI 2 是苹果研究团队最新发表的一款先进的多模态大型语言模型（MLLM），旨在实现跨多个平台的通用用户界面（UI）理解。

来自主题: AI技术研报

8170 点击 2024-11-01 12:27

利用大模型构建个性化虚拟学生代理：SOE框架的多维度评估研究

来自华东师范大学、南洋理工和中科院等高校的联合研究团队提出了一种新颖的人工智能教育框架“场景-对象-评估”（SOE），旨在利用大型语言模型（LLMs）构建能够模拟人类学生行为和个体差异的虚拟学生代理（LVSA）。

来自主题: AI技术研报

8085 点击 2024-11-01 12:06

大模型训练成本降一半！厦大和vivo联合推出预训练新策略，给LLM降本增效

近年来，大语言模型（Large Language Models, LLMs）的研究取得了重大进展，并对各个领域产生了深远影响。然而，LLMs的卓越性能来源于海量数据的大规模训练，这导致LLMs的训练成本明显高于传统模型。

来自主题: AI技术研报

4726 点击 2024-11-01 10:15

让机器人拥有人一样「潜意识」，英伟达1.5M小模型就能实现通用控制了

大模型固然性能强大，但限制也颇多。如果想在端侧塞进 405B 这种级别的大模型，那真是小庙供不起大菩萨。近段时间，小模型正在逐渐赢得人们更多关注。这一趋势不仅出现在语言模型领域，也出现在了机器人领域。

来自主题: AI技术研报

5016 点击 2024-10-31 15:06

探索LLM推理全阶段的JSON格式输出限制方法

文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

来自主题: AI技术研报

11331 点击 2024-10-31 10:14

重磅！IBM：PDL提示词声明语言，帮你拿回Prompt控制权

在当前大语言模型（LLM）蓬勃发展的环境下，Prompt工程师们面临着一个两难困境：要么使用像LangChain这样功能强大但学习曲线陡峭的框架，要么选择自动化程度更高DSPy但牺牲了对提示词精确控制的工具。IBM研究院和UC Davis大学最近推出的PDL（Prompt Declaration Language，提示词声明语言）或许打破了这个困境，让AI开发者能真正拿回Prompt的控制权。

来自主题: AI技术研报

6053 点击 2024-10-31 09:54