
翁荔离职OpenAI后第一个动作:万字长文探讨RLHF的漏洞,网友们抢着传看
翁荔离职OpenAI后第一个动作:万字长文探讨RLHF的漏洞,网友们抢着传看之前领导OpenAI安全团队的北大校友翁荔(Lilian Weng),离职后第一个动作来了。当然是发~博~客。这次的博客一如既往万字干货,妥妥一篇研究综述,翁荔本人直言写起来不容易。主题围绕强化学习中奖励黑客(Reward Hacking)问题展开,即Agent利用奖励函数或环境中的漏洞来获取高奖励,而并未真正学习到预期行为。
之前领导OpenAI安全团队的北大校友翁荔(Lilian Weng),离职后第一个动作来了。当然是发~博~客。这次的博客一如既往万字干货,妥妥一篇研究综述,翁荔本人直言写起来不容易。主题围绕强化学习中奖励黑客(Reward Hacking)问题展开,即Agent利用奖励函数或环境中的漏洞来获取高奖励,而并未真正学习到预期行为。
2024 年 12 月 1 月下午,奇绩创坛在北京中关村国际创新中心举办了 2024 年秋季创业营路演日,共有 60 家奇绩投资并加速的公司参与了路演。前沿创新信号:大模型(49 家),多模态(28 家),数据(24 家),具身智能(14 家),仿真(4 家)。
如果你是互联网重度用户,一定会发现最近社交平台上突然涌现出了一系列神秘的视频。 乍一看都是我们熟悉的影视剧经典桥段,但只要稍稍停下上滑的手指,就会发现哪里不对劲。
ChatGPT两岁了,版本更新没等来,却被发现一个神秘Bug。
不仅仅是“构建AGI”,要确保它造福人类! 政策研究部门核心人员离职! Rosie Campbell-OpenAI的政策研究员,也是原研究科学家、政策研究负责人Miles Brundage亲密共事的伙伴。
在这个信息爆炸的时代,我们每天都在被海量的数据淹没。如何从这些数据中挖掘出有价值的信息,已经成为了一个亟待解决的问题。今天,我们要给大家带来一个震撼人心的消息——AI界的两大神器,Hebbia和Wiseflow,正在改变我们获取和处理信息的方式。
AI巨头的芯片之争,谷歌微软目前分列一二。而xAI作为新入局者,正迅速崛起。这场竞争中,谁会成为最后赢家?
BioMap 百图生科宣布,全球人工智能领域的顶尖专家、西湖大学人工智能讲席教授——李子青教授出任百图生科首席科学家(AI大模型)。
“open”AI透明性有限,资源垄断难破。
最近,一支来自UCSD和清华的研究团队提出了一种全新的微调方法。经过这种微调后,一个仅80亿参数的小模型,在科学问题上也能和GPT-4o一较高下!或许,单纯地卷AI计算能力并不是唯一的出路。
智能客服行业掀起了一股大模型热。 “现在客户上来就问能用大模型打电话吗?如果没有大模型能力,客户就不跟你聊了”,云蝠智能CEO魏佳星告诉数智前线,市场对大模型客服的认知度在加速。
研究人员提出了一种方法,能够在领域数据分布持续变化的动态环境中,基于随机时刻观测的数据分布,在任意时刻生成适用的神经网络,实现前所未有的泛化能力。
LLM在推理时,竟是通过一种「程序性知识」,而非照搬答案?可以认为这是一种变相的证明:LLM的确具备某种推理能力。然而存在争议的是,这项研究只能提供证据,而非证明。
大语言模型直接理解复杂图结构的新方法来了:
提升LLM数学能力的新方法来了——
大语言模型(LLM)在各种任务上展示了卓越的性能。然而,受到幻觉(hallucination)的影响,LLM 生成的内容有时会出现错误或与事实不符,这限制了其在实际应用中的可靠性。
本文将介绍数学推理场景下的首个分布外检测研究成果。
自我博弈,很神奇吧?
Prime Intellect 宣布通过去中心化方式训练完成了一个 10B 模型。30 号,他们开源了一切,包括基础模型、检查点、后训练模型、数据、PRIME 训练框架和技术报告。据了解,这应该是有史以来首个以去中心化形式训练得到的 10B 大模型。
随着重返总统宝座,他的政府预计将利用先进的监控和人工智能工具来执行移民政策。拜登政府已经在使用的“飓风评分”算法和 SmartLINK 跟踪应用程序等技术可能会在特朗普提出的大规模驱逐计划中发挥重要作用。批评者认为,这些工具存在侵犯隐私、系统性偏见和潜在滥用的风险,而私人监狱公司则预计该计划将得到扩展。
大家好!我是李继刚,我想大家或多或少之前看到我去年写的Markdown格式提示词和今年写的lisp提示词,这两年写作风格变化非常大,中间经历了非常大的转折。
据ZP独家获悉,钛虎机器人科技(上海)有限公司(下称“钛虎机器人”或“公司”)近日宣布,公司连续完成Pre-A+和Pre-A++两轮融资,Pre-A系列合计融资金额超过一亿元人民币。
双深科技近日获得来自上市公司富瀚微(300613.SZ)的数千万元人民币战略投资。双深科技成立于2020年,是一家致力于用AI技术颠覆传统图像和视频压缩与处理的AI创业公司。团队研发实力雄厚,核心成员均来自国内外顶尖高校,并数次在国际人工智能顶级会议CVPR夺得图像与视频编解码领域的全球冠军,奠定了公司在技术上的领先地位。
编程语言圈子又出“新花样”了!“像 C 语言但更现代”或“像 C 语言但专为某些特定群体设计”。而这一次,我们迎来了一种专为 AI 设计的编程语言,可以称之为“适用于 AI 的 C 语言”。这次的新语言名为 Mirror,有一些独到之处。它的基本语法由两部分组成:定义的函数名称,以及输入输出示例。
Google研究院健康AI团队于近日推出了全新的开源模型套件——Health AI Developer Foundations(HAI-DEF)。在本次HAI-DEF的首次发布中,Google推出了三个专注于医疗影像应用的重要模型。首先是CXR Foundation胸部X光模型,其次是Derm Foundation皮肤影像模型,第三个是Path Foundation病理学模型,它基于ViT-S架构
因为比特币挖矿和AI训练都需要大量的能源和算力。两者的同步发展势必在电力和硬件资源上产生竞争。这意味着AI训练业务可能会受到比特币价格波动的影响,尤其是当矿工们争夺有限的硬件资源时。也就是说比特币价格的上涨,可能会带动AI训练成本的提升。
写毕业论文,可以用AI吗?
日本政府正以雷厉风行的姿态推进芯片和人工智能产业的战略布局。本财政年度,日本政府将追加1.5万亿日元(约合99亿美元)的特别预算,瞄准下一代芯片、量子计算机等前沿科技领域。
AI 大模型应用在手机输入法已经很长时间,所以,不聊打字功能,哪个输入法更好用?
“明天去北京出差适合穿什么衣服?明天的天气适合晨跑吗?”11月29日,中国气象局华风气象传媒集团(以下简称:中国气象局)联合支付宝推出首个国家级天气智能体“中国天气小助手”,由中国气象局提供权威气象数据,可为用户提供“查天气、穿衣推荐、气象科普等”多种气象领域服务,用户在支付宝首页下拉或下载支小宝APP即可使用。