AI资讯新闻榜单内容搜索-大语言模型

迈向多语言医疗大模型：大规模预训练语料、开源模型与全面基准测试

在医疗领域中，大语言模型已经有了广泛的研究。然而，这些进展主要依赖于英语的基座模型，并受制于缺乏多语言医疗专业数据的限制，导致当前的医疗大模型在处理非英语问题时效果不佳。

来自主题: AI技术研报

8933 点击 2024-09-29 22:38

长短大小样样精通！原始分辨率、超长视频输入：更灵活的全开源多模态架构Oryx

视觉数据的种类极其多样，囊括像素级别的图标到数小时的视频。现有的多模态大语言模型（MLLM）通常将视觉输入进行分辨率的标准化或进行动态切分等操作，以便视觉编码器处理。然而，这些方法对多模态理解并不理想，在处理不同长度的视觉输入时效率较低。

来自主题: AI资讯

3773 点击 2024-09-29 14:44

首个Mamba+Transformer混合架构多模态大模型来了，实现单卡千图推理

扩展多模态大语言模型（MLLMs）的长上下文能力对于视频理解、高分辨率图像理解以及多模态智能体至关重要。这涉及一系列系统性的优化，包括模型架构、数据构建和训练策略，尤其要解决诸如随着图像增多性能下降以及高计算成本等挑战。

来自主题: AI技术研报

8346 点击 2024-09-21 18:19

从架构、工艺到能效表现，全面了解LLM硬件加速，这篇综述就够了

大语言模型（LLM）的发展同时往往伴随着硬件加速技术的进化，本文对使用 FPGA、ASIC 等芯片的模型性能、能效表现来了一次全面概览。

来自主题: AI资讯

10624 点击 2024-09-20 13:29

华为诺亚联合中科大发布工具调用模型ToolACE，效果持平GPT-4获开源第一

大语言模型（如 GPT-4）具备强大的语言处理能力，但其独立运作时仍存在局限性，如无法进行复杂计算，获取不到实时信息，难以提供专业定制化功能等。而大语言模型的工具调用能力使其不仅限于文字处理，更能提供全面、实时、精确的服务，极大地扩展了其应用范围和实际价值。

来自主题: AI技术研报

8261 点击 2024-09-15 14:32

与「李白」赏图赋诗，同「猴哥」直面天命，人大高瓴提出MMRole多模态角色扮演

随着大语言模型的飞速发展，角色扮演智能体（RPAs）正逐渐成为 AI 领域的热门话题。

来自主题: AI资讯

5478 点击 2024-09-12 14:40

我用Cursor写了一个AI词典应用

我向来喜欢折腾新玩意。作为一个语言学习者，AI大语言模型出来以后我没少使用它。无论是备课还是日常工作和学习，大语言模型提供了各种各样的可能性，大大提升了效率。

来自主题: AI资讯

5860 点击 2024-09-10 16:05

还在死磕AI咒语？北大-百川搞了个自动提示工程系统PAS

论文共同第一作者郑淼，来自于周泽南领导的百川对齐团队，毕业于北京大学，研究方向包括大语言模型、多模态学习以及计算机视觉等，曾主导MMFlow等开源项目。

来自主题: AI技术研报

5786 点击 2024-09-10 11:40

名场面来了，李云龙、徐江、王多鱼同台飙戏，背后是小红书的AI

近日，来自小红书的技术团队 FireRed，提出了基于大语言模型的 FireRedTTS 语音合成系统，并分享了在短视频配音及聊天式语音对话等应用的一些实践。

来自主题: AI技术研报

6680 点击 2024-09-07 17:32

ECCV 2024 | 比基准高30%，媲美Gemini 1.5 Pro，基于记忆的视频理解智能体来了

视频理解仍然是计算机视觉和人工智能领域的一个主要挑战。最近在视频理解上的许多进展都是通过端到端地训练多模态大语言模型实现的[1,2,3]。然而，当这些模型处理较长的视频时，内存消耗可能会显著增加，甚至变得难以承受，并且自注意力机制有时可能难以捕捉长程关系 [4]。这些问题阻碍了将端到端模型进一步应用于视频理解。

来自主题: AI技术研报

8589 点击 2024-09-06 11:59