AI资讯新闻榜单内容搜索-LLM

视觉语言模型导论：这篇论文能成为你进军VLM的第一步

近些年，语言建模领域进展非凡。Llama 或 ChatGPT 等许多大型语言模型（LLM）有能力解决多种不同的任务，它们也正在成为越来越常用的工具。

来自主题: AI技术研报

10030 点击 2024-06-11 10:08

用神经架构搜索给LLM瘦身，模型变小，准确度有时反而更高

大型语言模型（LLM）的一个主要特点是「大」，也因此其训练和部署成本都相当高，如何在保证 LLM 准确度的同时让其变小就成了非常重要且有价值的研究课题。

来自主题: AI技术研报

10786 点击 2024-06-11 10:06

两句话，让LLM逻辑推理瞬间崩溃！最新「爱丽丝梦游仙境」曝出GPT、Claude等重大缺陷

在基准测试上频频屠榜的大模型们，竟然被一道简单的逻辑推理题打得全军覆没？最近，研究机构LAION的几位作者共同发表了一篇文章，以「爱丽丝梦游仙境」为启发涉及了一系列简单的推理问题，揭示了LLM基准测试的盲区。

来自主题: AI技术研报

10881 点击 2024-06-10 14:23

GPT-4欺骗人类高达99.16%惊人率！PNAS重磅研究曝出，LLM推理越强欺骗值越高

最近，德国研究科学家发表的PANS论文揭示了一个令人担忧的现象：LLM已经涌现出「欺骗能力」，它们可以理解并诱导欺骗策。而且，相比前几年的LLM，更先进的GPT-4、ChatGPT等模型在欺骗任务中的表现显著提升。

来自主题: AI技术研报

9498 点击 2024-06-09 18:23

FineWeb技术报告出炉！揭秘HuggingFace规模最大、质量最高预训练数据集

从大规模网络爬取、精细过滤到去重技术，通过FineWeb的技术报告探索如何打造高质量数据集，为大型语言模型（LLM）预训练提供更优质的性能。

来自主题: AI资讯

11232 点击 2024-06-09 18:06

从LLM中完全消除矩阵乘法，效果出奇得好，10亿参数跑在FPGA上接近大脑功耗

让语言模型「轻装上阵」。

来自主题: AI技术研报

10730 点击 2024-06-09 17:26

港大北航等1bit大模型引热议，IEEE刊物评“解决AI能源需求”！作者亲自解读在此

极限量化，把每个参数占用空间压缩到1.1bit！

来自主题: AI技术研报

10578 点击 2024-06-09 17:22

To Believe or Not to Believe？DeepMind新研究一眼看穿LLM幻觉

DeepMind发表了一篇名为「To Believe or Not to Believe Your LLM」的新论文，探讨了LLM的不确定性量化问题，通过「迭代提示」成功将LLM的认知不确定性和偶然不确定性解耦。研究还将新推导出的幻觉检测算法应用于Gemini，结果表明，与基线方法相比，该方法能有效检测幻觉。

来自主题: AI技术研报

10518 点击 2024-06-08 19:59

量化大模型退化严重？ETH北航字节推出LoRA新范式 | ICML 2024

大模型应用开卷，连一向保守的苹果，都已释放出发展端侧大模型的信号。

来自主题: AI技术研报

11417 点击 2024-06-08 16:13

全球开源新王Qwen2-72B诞生，碾压Llama3-70B击败国产闭源模型！AI圈大佬转疯了

一夜之间，全球最强开源模型再次易主。万众瞩目的Qwen2-72B一出世，火速杀进开源LLM排行榜第一，美国最强开源模型Llama3-70B直接被碾压！全球开发者粉丝狂欢：果然没白等。

来自主题: AI技术研报

11186 点击 2024-06-08 11:44