AI资讯新闻榜单内容搜索-LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LLM
首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理

首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理

首个Mamba+Transformer混合架构多模态大模型来了,实现单卡千图推理

扩展多模态大语言模型(MLLMs)的长上下文能力对于视频理解、高分辨率图像理解以及多模态智能体至关重要。这涉及一系列系统性的优化,包括模型架构、数据构建和训练策略,尤其要解决诸如随着图像增多性能下降以及高计算成本等挑战。

来自主题: AI技术研报
7724 点击    2024-09-21 18:19
CoT神话破灭,并非LLM标配!三大学府机构联手证实,CoT仅在数学符号推理有用

CoT神话破灭,并非LLM标配!三大学府机构联手证实,CoT仅在数学符号推理有用

CoT神话破灭,并非LLM标配!三大学府机构联手证实,CoT仅在数学符号推理有用

CoT只对数学、符号推理才起作用,其他的任务几乎没什么卵用!这是来自UT-Austin、霍普金斯、普林斯顿三大机构研究人员联手,分析了100+篇论文14类任务得出的结论。看来,CoT并非是所有大模型标配。

来自主题: AI资讯
9533 点击    2024-09-21 17:02
大佬亲身示范:操纵AI如此简单,LLM不仅「发疯」还造谣诽谤

大佬亲身示范:操纵AI如此简单,LLM不仅「发疯」还造谣诽谤

大佬亲身示范:操纵AI如此简单,LLM不仅「发疯」还造谣诽谤

当谷歌的Gemini建议给比萨加胶水时,网友尚能发挥娱乐精神玩梗解构;但当LLM输出的诽谤信息中伤到到真实人类时,AI搜索引擎的未来是否值得再三思量?

来自主题: AI技术研报
8817 点击    2024-09-20 20:04
从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了

从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了

从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了

大语言模型(LLM)的发展同时往往伴随着硬件加速技术的进化,本文对使用 FPGA、ASIC 等芯片的模型性能、能效表现来了一次全面概览。

来自主题: AI资讯
9935 点击    2024-09-20 13:29
斯坦福重磅,突破小规模语料瓶颈,EntiGraph合成数据增强算法让LLM更聪明

斯坦福重磅,突破小规模语料瓶颈,EntiGraph合成数据增强算法让LLM更聪明

斯坦福重磅,突破小规模语料瓶颈,EntiGraph合成数据增强算法让LLM更聪明

如何处理小众数据,如何让这些模型高效地学习专业领域的知识,一直是一个挑战。斯坦福大学的研究团队最近提出了一种名为EntiGraph的合成数据增强算法,为这个问题带来了新的解决思路。

来自主题: AI资讯
7138 点击    2024-09-20 10:31
时序=图像?无需微调,视觉MAE跨界比肩最强时序预测大模型

时序=图像?无需微调,视觉MAE跨界比肩最强时序预测大模型

时序=图像?无需微调,视觉MAE跨界比肩最强时序预测大模型

近期,浙大和 Salesforce 学者进一步发现:语言模型或许帮助有限,但是图像模型能够有效地迁移到时序预测领域。

来自主题: AI资讯
4079 点击    2024-09-19 15:24
实锤,我崩溃了,LLM根本无法100%根除幻觉

实锤,我崩溃了,LLM根本无法100%根除幻觉

实锤,我崩溃了,LLM根本无法100%根除幻觉

这个小假期,让我感觉很崩溃的是,一项新的研究彻底打破了我们的幻想:LLM的幻觉问题不仅难以解决,而且 从根本上来说是无法100%完全消除的。

来自主题: AI资讯
7921 点击    2024-09-18 16:53