AI资讯新闻榜单内容搜索-LLM

在Claude 3.5 Sonnet之前，这些AI Agent已能像人类一样操作电脑

这两天，Claude 3.5 Sonnet升级版刷爆了朋友圈，满屏都是：它能像人一样操作电脑。大语言模型（Large Language Model，LLM）能够像人一样操作电脑这件事，看起来蛮炸裂的，但在AI Agent圈子里早已经见多不怪了。

来自主题: AI技术研报

5929 点击 2024-10-25 16:40

深挖大模型幻觉！哈佛大学最新报告：LLM等价于众包，只是在输出「网络共识」

哈佛大学研究了大型语言模型在回答晦涩难懂和有争议问题时产生「幻觉」的原因，发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出，大模型在处理有广泛共识的问题时表现较好，但在面对争议性或信息不足的主题时则容易产生误导性的回答。

来自主题: AI资讯

5151 点击 2024-10-25 14:51

图像伪造照妖镜！北大发布多模态LLM图像篡改检测定位框架FakeShield

北京大学的研究人员开发了一种新型多模态框架FakeShield，能够检测图像伪造、定位篡改区域，并提供基于像素和图像语义错误的合理解释，可以提高图像伪造检测的可解释性和泛化能力。

来自主题: AI技术研报

5312 点击 2024-10-25 11:03

Nature专业户DeepMind又登封面，开源水印技术SynthID-Text，Gemini已经用上了

现如今，大型语言模型（LLM）生成的内容已经充斥了整个互联网，并且这些模型还能模仿各种类似真人的语气和行文风格，让人难以分辨眼前的文本究竟来自人类还是 AI。

来自主题: AI技术研报

3725 点击 2024-10-24 15:37

MIT韩松团队长上下文LLM推理高效框架DuoAttention：单GPU实现330万Token上下文推理

TL;DR：DuoAttention 通过将大语言模型的注意力头分为检索头（Retrieval Heads，需要完整 KV 缓存）和流式头（Streaming Heads，只需固定量 KV 缓存），大幅提升了长上下文推理的效率，显著减少内存消耗、同时提高解码（Decoding）和预填充（Pre-filling）速度，同时在长短上下文任务中保持了准确率。

来自主题: AI技术研报

4558 点击 2024-10-24 11:33

RAG真能提升LLM推理能力？人大最新研究：数据有噪声，RAG性能不升反降

RAG通过纳入外部文档可以辅助LLM进行更复杂的推理，降低问题求解所需的推理深度，但由于文档噪声的存在，其提升效果可能会受限。中国人民大学的研究表明，尽管RAG可以提升LLM的推理能力，但这种提升作用并不是无限的，并且会受到文档中噪声信息的影响。通过DPrompt tuning的方法，可以在一定程度上提升LLM在面对噪声时的性能。

来自主题: AI技术研报

3759 点击 2024-10-23 10:32

自动化、可复现，基于大语言模型群体智能的多维评估基准Decentralized Arena来了

Maitrix.org 是由 UC San Diego, John Hopkins University, CMU， MBZUAI 等学术机构学者组成的开源组织，致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。

来自主题: AI技术研报

5951 点击 2024-10-22 14:38