人大&港科大揭示大模型重要安全风险漏洞:利用概念激活向量破解大模型的安全对齐|NeurIPS 2024
人大&港科大揭示大模型重要安全风险漏洞:利用概念激活向量破解大模型的安全对齐|NeurIPS 2024利用概念激活向量破解大模型的安全对齐,揭示LLM重要安全风险漏洞。
来自主题: AI技术研报
3986 点击 2024-11-16 15:03
利用概念激活向量破解大模型的安全对齐,揭示LLM重要安全风险漏洞。
测评大模型Agent能力,从未如此直观。 新旧两版Claude 3.5 Sonnet在《我的世界》里PK盖楼,差距不要太明显,引来大量围观。
OpenAI奥特曼前天发了条神神秘秘的推文,“there is no wall”。
2024 年,AI 大模型从「以分计价」跨入「以厘计价」的时代。
2024年下半年,AI行业的人才流动呈现出戏剧性的转折:从科技巨头出走创业后,如今又选择回流大厂。
破解基因组的奥秘一直是生物科学的前沿挑战,如何让人工智能(AI)读懂 DNA 的复杂信息,并用它来设计和操控生命的“程序代码”?
高效组合多个大模型“取长补短”新思路,被顶会NeurIPS 2024接收。
大模型的具身智能决策能力,终于有系统的通用评估基准了。
大模型的发展呈现出追风逐日般的速度,但与之相伴的安全问题,也是频频被曝光。
大模型狂热继续,但今天依然沿着一条路或者一个路线图前进的公司或产品却并不多了,有的“模型”公司做着做着没模型了,有的从情感到生产力再到视觉做了个遍,有的干脆从c转到b,也不再批评过往b端必做的项目制了。