AI资讯新闻榜单内容搜索-Ai安全

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Ai安全
翁荔离职OpenAI后第一个动作:万字长文探讨RLHF的漏洞,网友们抢着传看

翁荔离职OpenAI后第一个动作:万字长文探讨RLHF的漏洞,网友们抢着传看

翁荔离职OpenAI后第一个动作:万字长文探讨RLHF的漏洞,网友们抢着传看

之前领导OpenAI安全团队的北大校友翁荔(Lilian Weng),离职后第一个动作来了。当然是发~博~客。这次的博客一如既往万字干货,妥妥一篇研究综述,翁荔本人直言写起来不容易。主题围绕强化学习中奖励黑客(Reward Hacking)问题展开,即Agent利用奖励函数或环境中的漏洞来获取高奖励,而并未真正学习到预期行为。

来自主题: AI技术研报
7150 点击    2024-12-03 00:16
面向代码语言模型的安全性研究全新进展,南大&NTU联合发布全面综述

面向代码语言模型的安全性研究全新进展,南大&NTU联合发布全面综述

面向代码语言模型的安全性研究全新进展,南大&NTU联合发布全面综述

近年来,代码语言模型(Language Models for Code,简称 CodeLMs)逐渐成为推动智能化软件开发的关键技术,应用场景涵盖智能代码生成与补全、漏洞检测与修复等。

来自主题: AI资讯
6832 点击    2024-11-19 20:35
刚刚,OpenAI安全副总裁、北大校友Lilian Weng宣布离职,有时间写博客了

刚刚,OpenAI安全副总裁、北大校友Lilian Weng宣布离职,有时间写博客了

刚刚,OpenAI安全副总裁、北大校友Lilian Weng宣布离职,有时间写博客了

翁荔的技术博客深入、细致,具有前瞻性,被很多 AI 研究者视为重要的参考资料。如今,她离开了 OpenAI,开启新的征程。而且她表示,之后可能有更多时间频繁更新博客。

来自主题: AI资讯
3710 点击    2024-11-09 10:38
翁荔,掌管OpenAI安全的北大校友,刚刚现身B站线下演讲

翁荔,掌管OpenAI安全的北大校友,刚刚现身B站线下演讲

翁荔,掌管OpenAI安全的北大校友,刚刚现身B站线下演讲

OpenAI研究副总裁(安全)翁荔(Lilian Weng),现身国内! 还首次在国内大型活动场合公开发表AI主题演讲。

来自主题: AI资讯
3956 点击    2024-11-02 10:13
14岁男孩杀死了自己,在此之前,他迷上了他的AI伴侣

14岁男孩杀死了自己,在此之前,他迷上了他的AI伴侣

14岁男孩杀死了自己,在此之前,他迷上了他的AI伴侣

10月23日,此前因被创始人“抛弃”而不再怎么被提及的AI陪伴产品鼻祖Character.ai,在x官方账号上发布了一条声明

来自主题: AI资讯
3367 点击    2024-10-24 10:47