AI资讯新闻榜单内容搜索-安全

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 安全
LLM越狱攻击的威胁被系统性高估? 基于分解式评分的「越狱评估新范式」出炉

LLM越狱攻击的威胁被系统性高估? 基于分解式评分的「越狱评估新范式」出炉

LLM越狱攻击的威胁被系统性高估? 基于分解式评分的「越狱评估新范式」出炉

可惜,目前 LLM 越狱攻击(Jailbreak)的评估往往就掉进了这些坑。常见做法要么依赖关键词匹配、毒性分数等间接指标,要么直接用 LLM 来当裁判做宏观判断。这些方法往往只能看到表象,无法覆盖得分的要点,导致评估容易出现偏差,很难为不同攻击的横向比较和防御机制的效果验证提供一个坚实的基准。

来自主题: AI技术研报
8631 点击    2025-10-17 15:33
当Search Agent遇上不靠谱搜索结果,清华团队祭出自动化红队框架SafeSearch

当Search Agent遇上不靠谱搜索结果,清华团队祭出自动化红队框架SafeSearch

当Search Agent遇上不靠谱搜索结果,清华团队祭出自动化红队框架SafeSearch

在 AI 发展的新阶段,大模型不再局限于静态知识,而是可以通过「Search Agent」的形式实时连接互联网。搜索工具让模型突破了训练时间的限制,但它们返回的并非总是高质量的资料:一个低质量网页、一条虚假消息,甚至是暗藏诱导的提示,都可能在用户毫无察觉的情况下被模型「采纳」,进而生成带有风险的回答。

来自主题: AI技术研报
8235 点击    2025-10-17 09:33
NTU等联合提出A-MemGuard:为AI记忆上锁,投毒攻击成功率暴降95%

NTU等联合提出A-MemGuard:为AI记忆上锁,投毒攻击成功率暴降95%

NTU等联合提出A-MemGuard:为AI记忆上锁,投毒攻击成功率暴降95%

在AI智能体日益依赖记忆系统的时代,一种新型攻击悄然兴起:记忆投毒。A-MemGuard作为首个专为LLM Agent记忆模块设计的防御框架,通过共识验证和双重记忆结构,巧妙化解上下文依赖与自我强化错误循环的难题,让AI从被动受害者转为主动守护者,成功率高达95%以上。

来自主题: AI技术研报
7944 点击    2025-10-16 14:51
250份文档就能给大模型植入后门:不分参数规模

250份文档就能给大模型植入后门:不分参数规模

250份文档就能给大模型植入后门:不分参数规模

大模型安全的bug居然这么好踩??250份恶意文档就能给LLM搞小动作,不管模型大小,600M还是13B,中招率几乎没差。这是Claude母公司Anthropic最新的研究成果。

来自主题: AI技术研报
9945 点击    2025-10-11 12:04
管你模型多大,250份有毒文档统统放倒,Anthropic:迄今为止规模最大的大模型数据投毒调查

管你模型多大,250份有毒文档统统放倒,Anthropic:迄今为止规模最大的大模型数据投毒调查

管你模型多大,250份有毒文档统统放倒,Anthropic:迄今为止规模最大的大模型数据投毒调查

本次新研究是迄今为止规模最大的大模型数据投毒调查。Anthropic 与英国人工智能安全研究所(UK AI Security Institute)和艾伦・图灵研究所(Alan Turing Institute)联合进行的一项研究彻底打破了这一传统观念:只需 250 份恶意文档就可能在大型语言模型中制造出「后门」漏洞,且这一结论与模型规模或训练数据量无关。

来自主题: AI技术研报
9527 点击    2025-10-10 12:14
DeepMind发布代码修复AI智能体CodeMender,实现「被动响应」与「主动防御」一体化

DeepMind发布代码修复AI智能体CodeMender,实现「被动响应」与「主动防御」一体化

DeepMind发布代码修复AI智能体CodeMender,实现「被动响应」与「主动防御」一体化

近日,DeepMind 最新推出了一种全新的用于代码安全的 AI Agent—CodeMender,它使用 Gemini Deep Think 自动修补关键软件漏洞。它会检查补丁是否正确、是否能够修复根本原因,并且不会引起其他任何破坏。这确保只有高质量的解决方案才会被发送给人工审核。

来自主题: AI资讯
9433 点击    2025-10-07 22:13
研究表明AI可伪装有害蛋白,微软Science发文揭示“零日漏洞”,DNA合成公司紧急升级筛查系统

研究表明AI可伪装有害蛋白,微软Science发文揭示“零日漏洞”,DNA合成公司紧急升级筛查系统

研究表明AI可伪装有害蛋白,微软Science发文揭示“零日漏洞”,DNA合成公司紧急升级筛查系统

近日,微软和多家公司、高校、研究机构组成的联合团队在生物科学领域发现了一个重大的“零日漏洞”。他们利用开源的人工智能蛋白质设计工具,基于 72 种已知危险蛋白,模拟生成了 7 万多种原始有害蛋白质的变体,并将它们放入 4 种现有的生物安全筛查系统中。

来自主题: AI资讯
9582 点击    2025-10-03 22:07
做MCP的基础设施,种子轮就拿3500万美金,让AI Agent像管理容器一样简单

做MCP的基础设施,种子轮就拿3500万美金,让AI Agent像管理容器一样简单

做MCP的基础设施,种子轮就拿3500万美金,让AI Agent像管理容器一样简单

Obot MCP Gateway是他们解决方案的核心,这是一个开源控制平面,为IT团队提供了对MCP部署前所未有的可见性和控制能力。从架构上看,这个网关采用了代理模式,所有与MCP服务器的通信都会通过网关进行代理,这为审计、日志记录和应用安全策略提供了单一控制点。这种设计消除了影子AI的可能性,确保了合规性。

来自主题: AI资讯
9641 点击    2025-10-03 00:02
宇树机器人被曝漏洞,机器人之间可相互感染,官方火速回应

宇树机器人被曝漏洞,机器人之间可相互感染,官方火速回应

宇树机器人被曝漏洞,机器人之间可相互感染,官方火速回应

宇树旗下多款机器人,被曝存在严重的无线安全漏洞!消息由IEEE Spectrum报道指出。具体情况是这样的——多款不同型号的宇树机器人BLE(蓝牙低功耗)Wi-Fi 配置界面存在严重漏洞,攻击者可借此实现最高权限控制。

来自主题: AI资讯
7434 点击    2025-09-30 12:56
AI老司机现身重庆!徐峥挑战赛车手,上演「不再囧途」

AI老司机现身重庆!徐峥挑战赛车手,上演「不再囧途」

AI老司机现身重庆!徐峥挑战赛车手,上演「不再囧途」

从重庆魔幻山城到全球Robotaxi布局,千里科技展现出将AI融入物理世界的雄心。董事长印奇的「千里计划」——One Brain, One OS, One Agent——勾勒出跨场景智能生态,让汽车成为高效、安全的现实世界入口和未来的人类伙伴。

来自主题: AI资讯
7493 点击    2025-09-30 11:10