AI资讯新闻榜单内容搜索-幻觉检测

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 幻觉检测
传统PC巨头IBM发布了最新的Granite3.1模型,跑分超过Llama3.1、Qwen2.5 和谷歌的 Gemma2

传统PC巨头IBM发布了最新的Granite3.1模型,跑分超过Llama3.1、Qwen2.5 和谷歌的 Gemma2

传统PC巨头IBM发布了最新的Granite3.1模型,跑分超过Llama3.1、Qwen2.5 和谷歌的 Gemma2

IBM 正式发布了其新一代开源大语言模型 Granite 3.1,这是一组轻量级、先进的开源基础模型,支持多语言、代码生成、推理和工具使用,能够在有限的计算资源上运行。这一系列模型具备 128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。

来自主题: AI资讯
8389 点击    2024-12-25 09:57
To Believe or Not to Believe?DeepMind新研究一眼看穿LLM幻觉

To Believe or Not to Believe?DeepMind新研究一眼看穿LLM幻觉

To Believe or Not to Believe?DeepMind新研究一眼看穿LLM幻觉

DeepMind发表了一篇名为「To Believe or Not to Believe Your LLM」的新论文,探讨了LLM的不确定性量化问题,通过「迭代提示」成功将LLM的认知不确定性和偶然不确定性解耦。研究还将新推导出的幻觉检测算法应用于Gemini,结果表明,与基线方法相比,该方法能有效检测幻觉。

来自主题: AI技术研报
8621 点击    2024-06-08 19:59
开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件

开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件

开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件

大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见,这也算是一种形式的幻觉。

来自主题: AI资讯
6461 点击    2023-12-10 15:11