AI资讯新闻榜单内容搜索-语言模型

36 亿融资“造假”被揭穿，挣钱太难了，前苹果 AI 工程师 3 年打造的“欧洲 OpenAI”宣告退出模型竞赛

近日 Aleph Alpha 开始将其商业重点从开发大型语言模型转向生成式 AI 操作系统和咨询服务。

来自主题: AI资讯

9419 点击 2024-09-11 09:33

我用Cursor写了一个AI词典应用

我向来喜欢折腾新玩意。作为一个语言学习者，AI大语言模型出来以后我没少使用它。无论是备课还是日常工作和学习，大语言模型提供了各种各样的可能性，大大提升了效率。

来自主题: AI资讯

6093 点击 2024-09-10 16:05

突破医疗影像分析：AI如何通过语言引导实现自我学习与精准分类

本文提出了一种名为MedUnA的方法，旨在解决医疗图像分类中因缺乏标注数据而导致的监督学习挑战。MedUnA利用视觉-语言模型（VLMs）中的视觉与文本对齐特性，通过无监督学习来适应医疗图像分类任务。

来自主题: AI资讯

5347 点击 2024-09-10 14:39

还在死磕AI咒语？北大-百川搞了个自动提示工程系统PAS

论文共同第一作者郑淼，来自于周泽南领导的百川对齐团队，毕业于北京大学，研究方向包括大语言模型、多模态学习以及计算机视觉等，曾主导MMFlow等开源项目。

来自主题: AI技术研报

6116 点击 2024-09-10 11:40

大模型边推理边纠错，有可能做到吗？这是ICML爆火的演讲

即便是最强大的语言模型（LLM），仍会偶尔出现推理错误。除了通过提示词让模型进行不太可靠的多轮自我纠错外，有没有更系统的方法解决这一问题呢？

来自主题: AI资讯

10241 点击 2024-09-08 15:57

名场面来了，李云龙、徐江、王多鱼同台飙戏，背后是小红书的AI

近日，来自小红书的技术团队 FireRed，提出了基于大语言模型的 FireRedTTS 语音合成系统，并分享了在短视频配音及聊天式语音对话等应用的一些实践。

来自主题: AI技术研报

7141 点击 2024-09-07 17:32

ECCV 2024 | 比基准高30%，媲美Gemini 1.5 Pro，基于记忆的视频理解智能体来了

视频理解仍然是计算机视觉和人工智能领域的一个主要挑战。最近在视频理解上的许多进展都是通过端到端地训练多模态大语言模型实现的[1,2,3]。然而，当这些模型处理较长的视频时，内存消耗可能会显著增加，甚至变得难以承受，并且自注意力机制有时可能难以捕捉长程关系 [4]。这些问题阻碍了将端到端模型进一步应用于视频理解。

来自主题: AI技术研报

9129 点击 2024-09-06 11:59

Meta：大语言模型可以通过自我批判取得大幅提升！

论文的审稿模式想必大家都不会陌生，一篇论文除了分配多个评审，最后还将由PC综合评估各位审稿人的reviews撰写meta-review。

来自主题: AI技术研报

7821 点击 2024-09-04 23:07

覆盖 7 百万问答数据，上海 AI Lab 发布 ChemLLM，专业能力比肩 GPT-4

内含一键部署教程

来自主题: AI技术研报

8341 点击 2024-09-04 17:42

为边缘开发由生成式 AI 赋能的视觉 AI 智能体

视觉语言模型（VLM）这项 AI 技术所取得的突破令人振奋。它提供了一种更加动态、灵活的视频分析方法。VLM 使用户能够使用自然语言与输入的图像和视频进行交互，因此更加易于使用且更具适应性。这些模型可以通过 NIM 在 NVIDIA Jetson Orin 边缘 AI 平台或独立 GPU 上运行。本文将探讨如何构建基于 VLM 的视觉 AI 智能体，这些智能体无论是在边缘抑或是在云端都能运行。

来自主题: AI技术研报

8927 点击 2024-09-04 16:04