具身智能体主动迎战对抗攻击,清华团队提出主动防御框架
具身智能体主动迎战对抗攻击,清华团队提出主动防御框架面对对抗攻击,具身智能体除了被动防范,也能主动出击! 在人类视觉系统启发下,清华朱军团队在TPMAI 2025中提出了强化学习驱动的主动防御框架REIN-EAD。
面对对抗攻击,具身智能体除了被动防范,也能主动出击! 在人类视觉系统启发下,清华朱军团队在TPMAI 2025中提出了强化学习驱动的主动防御框架REIN-EAD。
智能体元年,处处都是智能体。甚至刚落幕的ISC.AI 2025第十三届互联网安全大会,主题直接就是“ALL IN AGENT”。
生成式AI安全风险:注入攻击、隐私泄露、供应链隐患;防御需零信任、红队演练。
日前有网友发现沉浸式翻译扩展程序的部分用户数据暴露在互联网上,这些数据包含部分敏感内容例如加密货币钱包私钥甚至是企业 / 机构的商业合同等。严格来说此次问题并非安全漏洞而是沉浸式翻译提供的功能存在缺陷,即没有对快照链接进行保护导致搜索引擎爬虫可以直接抓取内容并将其放置互联网上公开索引。
AI对话技术最初用于年轻人整蛊父母的声音克隆,但老年人主动用作“情感拐杖”缓解孤独,带来安全倾诉环境。心理咨询师警告AI可能导致即时反馈成瘾、替代真实关系,削弱现实冲突应对力,类似《her》电影困境;AI谄媚性模糊是非,影响判断力。技术初衷高效连接需求,却简化人际复杂本质。
Tavily,一家为AI提供企业级安全搜索API的初创公司,于近日完成2000万美元的A轮融资,由Insight Partners领投,公司累计融资额达2500万美元。Tavily源自其创始人在2023年创建的、在GitHub上广受欢迎的开源项目GPT Researcher,专注于解决AI智能体在访问互联网时面临的合规与安全挑战。
一波未平,一波又起。 英伟达Triton推理服务器,被安全研究机构Wiz Research曝光了一组高危漏洞链。
近日,ChatGPT 用户们震惊地发现,自己与该人工智能模型的聊天记录竟出现在了谷歌搜索结果中。有用户发现,他们可以通过谷歌搜索“ site:chatgpt.com/share ”来查找数千条陌生人与人工智能助手的对话。
陶哲轩最新发文总结AI领域现状,当前AI发展高度依赖经验与算力,缺乏理论支撑,导致成功难以复制、失败无法解释。辛顿、Rahimi、Jordan等也纷纷警示,AI的黑箱本质和缺乏解释性将限制其可持续发展。唯有建立坚实理论基础,AI才能真正走向透明、安全与可靠的未来。
Anthropic突封OpenAI的ClaudeAPI,指其违约用Claude支援即将发布的GPT-5开发及安全测试。此举标志AI巨头围绕数据与接口展开新一轮封锁战,API成市场准入与创新博弈的战略资源,在业内引发热议与监管关注。