AI资讯新闻榜单内容搜索-安全

AI失忆术！只需3个注意力头，就能让大模型忘记「狗会叫」

AI也能选择性失忆？Meta联合NYU发布新作，轻松操控缩放Transformer注意头，让大模型「忘掉狗会叫」。记忆可删、偏见可调、安全可破，掀开大模型「可编辑时代」，安全边界何去何从。

来自主题: AI技术研报

5750 点击 2025-07-14 11:34

攻克「恶意投毒」攻击！华南理工联合霍普金斯和UCSD，连登TPAMI、TIFS顶刊

华南理工大学计算机学院AI安全团队长期深耕于人工智能安全，近期联合约翰霍普金斯大学和加州大学圣地亚戈分校聚焦于联邦学习中防范恶意投毒攻击，产出工作连续发表于AI顶刊TPAMI 2025和网络安全顶刊TIFS 2025。

来自主题: AI技术研报

5898 点击 2025-07-13 11:45

ICML 2025 Oral！北大和腾讯优图破解AI生成图像检测泛化难题：正交子空间分解

随着 OpenAI 推出 GPT-4o 的图像生成功能，AI 生图能力被拉上了一个新的高度，但你有没有想过，这光鲜亮丽的背后也隐藏着严峻的安全挑战：如何区分生成图像和真实图像？

来自主题: AI技术研报

5123 点击 2025-07-13 11:30

麦当劳AI招聘系统被30分钟攻破，6400万求职者信息一览无遗

据外媒7月11日报道，该平台采用了Paradox.ai开发的AI聊天机器人“Olivia”（奥利维亚），用于收集求职者的个人信息，包括姓名、电话、邮箱、住址等敏感数据。然而，平台的安全防护存在严重缺陷。

来自主题: AI资讯

7101 点击 2025-07-13 10:02

MCP协议曝出大漏洞：会泄露整个数据库

所有使用MCP协议的企业注意：你的数据库可能正在“裸奔”！

来自主题: AI资讯

5635 点击 2025-07-11 11:37

长思维链里的推理步骤，哪些最关键？三招锁定LLM的「命门句子」

思维链里的步骤很重要，但有些步骤比其他步骤更重要，尤其是在一些比较长的思维链中。找出这些步骤，我们就可以更深入地理解 LLM 的内部推理机制，从而提高模型的可解释性、可调试性和安全性。

来自主题: AI技术研报

5482 点击 2025-07-09 10:51

Cursor 搭 MCP，一句话就能让数据库裸奔！？不是代码bug，是MCP 天生架构设计缺陷

安全研究团队 General Analysis 日前警告称，如果你使用了 Cursor 搭配 MCP，有可能在毫不知情的情况下，把你的整个 SQL 数据库泄露出去——而攻击者仅靠一条“看起来没什么问题”的用户信息就能做到这一点。

来自主题: AI资讯

5958 点击 2025-07-08 12:28

Claude 即将发布Claude Neptune v3模型，数学能力超强

据权威媒体报道，Anthropic正在紧锣密鼓地测试代号为“Claude Neptune v3”的全新AI模型。这一消息引发了AI社区的广泛关注，许多业内人士推测，Neptune v3可能是Claude4.5的雏形，甚至可能在未来数周内正式发布。作为Anthropic在AI安全与性能领域的又一力作，Neptune v3的亮相无疑将为行业带来新的期待。

来自主题: AI资讯

7543 点击 2025-07-07 17:12

首个GUI多模态大模型智能体可信评测框架+基准：MLA-Trust

MLA-Trust 是首个针对图形用户界面（GUI）环境下多模态大模型智能体（MLAs）的可信度评测框架。该研究构建了涵盖真实性、可控性、安全性与隐私性四个核心维度的评估体系，精心设计了 34 项高风险交互任务，横跨网页端与移动端双重测试平台，对 13 个当前最先进的商用及开源多模态大语言模型智能体进行深度评估，系统性揭示了 MLAs 从静态推理向动态交互转换过程中所产生的可信度风险。

来自主题: AI技术研报

6522 点击 2025-07-05 13:02

让GUI智能体不再「过度执行」，上海交大、Meta联合发布OS-Kairos系统

本文第一作者是上海交通大学计算机学院三年级博士生程彭洲，研究方向为多模态大模型推理、AI Agent、Agent 安全等。通讯作者为张倬胜助理教授和刘功申教授。

来自主题: AI技术研报

8210 点击 2025-07-03 11:03

AI资讯新闻榜单内容搜索-安全

AI失忆术！只需3个注意力头，就能让大模型忘记「狗会叫」

攻克「恶意投毒」攻击！华南理工联合霍普金斯和UCSD，连登TPAMI、TIFS顶刊

ICML 2025 Oral！北大和腾讯优图破解AI生成图像检测泛化难题：正交子空间分解

麦当劳AI招聘系统被30分钟攻破，6400万求职者信息一览无遗

MCP协议曝出大漏洞：会泄露整个数据库

长思维链里的推理步骤，哪些最关键？三招锁定LLM的「命门句子」

Cursor 搭 MCP，一句话就能让数据库裸奔！？不是代码bug，是MCP 天生架构设计缺陷

​Claude 即将发布Claude Neptune v3模型，数学能力超强

首个GUI多模态大模型智能体可信评测框架+基准：MLA-Trust

让GUI智能体不再「过度执行」，上海交大、Meta联合发布OS-Kairos系统

Claude 即将发布Claude Neptune v3模型，数学能力超强