AI资讯新闻榜单内容搜索-训练

专抓AI“看图说谎”，谷歌哥大用三类陷阱触发幻觉，打造可随技术发展动态演进的评估框架

幻觉（Hallucination），即生成事实错误或不一致的信息，已成为视觉-语言模型 (VLMs）可靠性面临的核心挑战。随着VLMs在自动驾驶、医疗诊断等关键领域的广泛应用，幻觉问题因其潜在的重大后果而备受关注。

来自主题: AI技术研报

6030 点击 2025-03-29 15:36

继昨天《RAG太折磨人啦，试下pip install rankify，检索、重排序、RAG三合一，完美》发布之后，有许多朋友向我询问Rankify的具体使用方法和部署细节，尤其是生产环境如何处理自定义数据集和本地数据集。

来自主题: AI技术研报

5578 点击 2025-03-29 15:23

从单张图像生成灵活视角3D场景的技术来了，在考古保护、自主导航等直接获取3D数据成本高昂或不可行的领域具有重要应用价值。

来自主题: AI技术研报

6122 点击 2025-03-29 14:34

近一年以来，AI 视频生成技术发展迅猛。自 2024 年初 Sora 问世后，大家惊喜地发现：原来 AI 可以生成如此逼真的视频，一时间各大高校实验室、互联网巨头 AI Lab 以及创业公司纷纷入局视频生成领域。

来自主题: AI技术研报

6077 点击 2025-03-29 14:13

三维高斯泼溅（3D Gaussian Splatting, 3DGS）技术基于高斯分布的概率模型叠加来表征场景，但其重建结果在几何和纹理边界处往往存在模糊问题。

来自主题: AI技术研报

8231 点击 2025-03-29 13:40

「仅需一次前向推理，即可预测相机参数、深度图、点云与 3D 轨迹 ——VGGT 如何重新定义 3D 视觉？」

来自主题: AI技术研报

6514 点击 2025-03-29 13:31

AI的运作始终笼罩着一层神秘的「黑箱」迷雾。这种不透明让AI有时会「胡说八道」，甚至故意撒谎。Anthropic刚刚推出了一项突破性研究，用类似大脑扫描的技术，深入Claude 3.5 Haiku的「脑子」，揭开了它运行的一些秘密。

来自主题: AI资讯

9009 点击 2025-03-28 17:45

「思维链劫持」（H-CoT）的攻击方法，成功攻破了包括OpenAI o1/o3、DeepSeek-R1等在内的多款大型推理模型的安全防线。研究表明，这些模型的安全审查过程透明化反而暴露了弱点，攻击者可以利用其内部推理过程绕过安全防线，使模型拒绝率从98%骤降2%。

来自主题: AI技术研报

6316 点击 2025-03-28 16:09

Spatial-RAG结合了空间数据库和大型语言模型（LLM）的能力，能够处理复杂的空间推理问题。通过稀疏和密集检索相结合的方式，Spatial-RAG可以高效地从空间数据库中检索出满足用户查询的空间对象，并利用LLM的语义理解能力对这些对象进行排序和生成最终答案。

来自主题: AI技术研报

5848 点击 2025-03-28 15:47

你是否曾经用最先进的大语言模型处理企业文档，却发现它把财务报表中的“$1,234.56”读成了“123456”？或者在处理医疗记录时，将“0.5mg”误读为“5mg”？对于依赖数据准确性的运营和采购团队来说，这些问题不仅影响工作效率，更可能导致财务损失、法律风险甚至造成医疗事故。

来自主题: AI技术研报

6007 点击 2025-03-28 10:25