AI资讯新闻榜单内容搜索-安全

ICLR 2026 | 在Moltbook之外，上交大联合上海AI Lab模拟了AI原⽣社交的「真实暗⾯」

本⽂的主要作者来⾃上海交通⼤学和上海⼈⼯智能实验室，核⼼贡献者包括任麒冰、郑志杰、郭嘉轩，指导⽼师为⻢利庄⽼师和邵婧⽼师，研究⽅向为安全可控⼤模型和智能体。最近，Moltbook 的爆⽕与随后的迅速

来自主题: AI技术研报

10177 点击 2026-02-11 12:32

AgentDoG：为AI智能体戴上「诊断项圈」

随着 AI 智能体（Agent）能力日益强大，其自主行为带来的安全风险也愈发复杂。现有安全工具往往只能给出「安全 / 不安全」的简单判断，无法告知我们风险的根源。为此，上海人工智能实验室正式开源 Ag

来自主题: AI技术研报

8510 点击 2026-02-08 11:49

Claude新模型4.6来了！更多饭碗没了：华尔街财务、编译器、安全白帽、PPT…通通失守

一睁眼，Anthropic上新模型，让Claude Opus 4.6来给您拜！年！了！

来自主题: AI资讯

6619 点击 2026-02-06 12:17

Moltbook漏洞大到可以冒充Karpathy发帖，黑客都急了

上周末，号称「AI 版 Reddit」的 Moltbook 闹得沸沸扬扬。

来自主题: AI资讯

9777 点击 2026-02-03 09:12

OpenClaw们狂奔，谁来焊死安全车门？

OpenClaw、Moltbook彻底火了。

来自主题: AI资讯

10998 点击 2026-02-03 08:43

速递｜AI安全初创公司Outtake“全明星”背书，ARR同比增长六倍，B轮融资4000万美元

提供智能化网络安全平台以协助企业检测、调查并清除身份欺诈的Outtake，已成功筹集 4000 万美元 B 轮融资。

来自主题: AI资讯

9644 点击 2026-02-02 13:29

爆火的 Moltbook，疯狂社交的 AI，却可能创造了最大的「AI 安全事件」

AI 社交网络 Moltbook 数据库完全暴露，15 万 AI「居民」的密钥可被任意接管。

来自主题: AI资讯

9330 点击 2026-02-02 13:24

ClawdBot，正在引爆全球灾难！各大CEO预警：不要安装，不要安装

一夜爆红的ClawdBot，正在把无数公司和个人推向深渊：端口裸奔、无鉴权、可被远程接管。现在，暴力破解、数据清空已经真实发生了，这不是危言耸听。各位CEO纷纷预警：ClawdBot，正在酝酿一场全球灾难！

来自主题: AI资讯

7771 点击 2026-01-28 15:31

大模型哪里出问题、怎么修，这篇可解释性综述一次讲清

过去几年，机制可解释性（Mechanistic Interpretability）让研究者得以在 Transformer 这一 “黑盒” 里追踪信息如何流动、表征如何形成：从单个神经元到注意力头，再到跨层电路。但在很多场景里，研究者真正关心的不只是 “模型为什么这么答”，还包括 “能不能更稳、更准、更省，更安全”。

来自主题: AI技术研报

10765 点击 2026-01-28 10:13

「迄今为止最伟大的 AI 应用」的 Clawdbot，或许并不适合你｜AI 上新

AI 员工很美好，但现阶段的它还很「危险」。

来自主题: AI资讯

8753 点击 2026-01-27 10:13