
离职OpenAI后Lilian Weng博客首发!深扒RL训练漏洞,业内狂赞
离职OpenAI后Lilian Weng博客首发!深扒RL训练漏洞,业内狂赞Lilian Weng离职OpenAI后首篇博客发布!文章深入讨论了大模型强化学习中的奖励欺骗问题。随着语言模型在许多任务上的泛化能力不断提升,以及RLHF逐渐成为对齐训练的默认方法,奖励欺骗在语言模型的RL训练中已经成为一个关键的实践性难题。
Lilian Weng离职OpenAI后首篇博客发布!文章深入讨论了大模型强化学习中的奖励欺骗问题。随着语言模型在许多任务上的泛化能力不断提升,以及RLHF逐渐成为对齐训练的默认方法,奖励欺骗在语言模型的RL训练中已经成为一个关键的实践性难题。
近年来,精神心理健康行业的热度显著上升。根据动脉橙数据库的统计,自2021年3月起,该行业内共有14家企业成功获得17笔融资,融资总金额已超过10亿元。这其中,包括好心情、昭阳健康、简单心理和壹点灵等知名企业。
当前构建数字世界有三条路线:OpenAI的Sora追求视觉真实,谷歌的Genie 2注重实时交互,World Labs专注空间准确。这三条路线各有优势,也各有无法在短期内解决的问题。
Show Lab 和微软推出 ShowUI,这是一个刚刚开源的 UI Agent 模型,在中文 APP 定位和导航能力上表现出色。通过创新的视觉 token 选择和独特的训练数据构建方法,该模型在有限的训练数据下实现了非常棒的性能。
搭上AI概念股后能否“绝地反击”,仍是个问题。
近年来,人工智能技术突飞猛进,在图像生成领域也取得了显著成果。然而,大多数模型在生成人物肖像时,往往难以准确捕捉中国人的外貌特征和审美偏好。
这两天,北京大学等研究团队发布了一个视频生成的可控生成工作:ConsisID。ConsisID可以实现无需训练Lora的保持参考人脸一致性的文生视频,类似之前图像生成的IP-Adapter-Face和InstantID等工作。虽然之前也有类似的工作,但是ConsisID在效果更上一个台阶。
《智能涌现》获悉,美国硅谷AI视觉领域企业“Luma AI”近日完成新一轮融资,金额为9000万美元。《智能涌现》获悉,美国硅谷AI视觉领域企业“Luma AI”近日完成新一轮融资,金额为9000万美元。
就在刚刚,满血版o1震撼上线了!它首次将多模态和新的推理范式结合起来,更智能、更快速。同时推出的还有200美元/月的专业版ChatGPT Pro。奥特曼亲自和Jason Wei等人做了演示,同时放出的,还有49页完整论文。据网友预测,GPT-4.5可能也要来了。
12月5日,知名投资人、金沙江创投主管合伙人朱啸虎接连发朋友圈,对前金沙江创投主管合伙人、现已经入职月之暗面的张予彤直接开炮。在当天早些时候,朱啸虎通过两条朋友圈对“月之暗面创始人杨植麟和联合创始人兼CTO张宇韬近期被循环智能时期投资人提起的仲裁事件”进行了回应。
OPPO 与 Google Cloud 在 AI 技术上深入合作,在旗下的海外手机上实现 AI 功能,这些 AI 功能为 OPPO 手机带来了更好的使用体验,为用户的日常生活和使用提供了便利和乐趣,在办公场景下也可以帮助用户大大提高工作效率,AI 手机给 OPPO 带来独特的竞争优势。OPPO AI 手机也是首批应用 Gemini 家族模型的产品。
CNNIC最新发布的《生成式人工智能应用发展报告(2024)》报告则显示,智能体成为生成式人工智能应用主流形态之一,截至今年6月,我国生成式人工智能产品的用户规模达2.3亿人,占整体人口的16.4%。 这意味着,几乎每六个中国人中就有一人正在使用AI产品。AI产品都在向智能体过渡的趋势下,半年后的现在,使用AI智能体的用户可能更多。
在比特币站上10万美元的高点后,美图员工今年的年终奖,应该也有了着落。 12月4日,美图公司(下称“美图”)在港交所公告称,公司自2024年11月开始在市场上出售其已购买加密货币。
如果说有一类游戏贯穿AI发展的始终,围绕其诞生的Thinking Game至今仍影响着最前沿AI技术的发展,那么答案很显然: 棋类游戏。
2024即将进入尾声,今年的大模型战场与以往有什么不同? 模型更大、模态更多,但更重要的,是基础模型不再是投资者竞相争抢的香饽饽,百模大战的战场,已经转移到了应用侧。
AI助手成了年轻人的「问题树洞」。
谁又能够成为“中国AI第一城”呢? 2024年,全球科技巨头的目光都放在了人工智能和Chat GPT上。
在数字化浪潮席卷全球的今天,数据已成为企业最宝贵的资产之一。如何从海量数据中提取有价值的信息,转化为决策支持,是每个企业都在积极探索的问题。
高中就辍学的瑞典小哥,5年后竟然入职OpenAI Sora团队当研究科学家了!
重磅!12月5日起,OpenAI将开始连续12天的圣诞马拉松。根据外媒The Verge的内部消息,满血版o1和Sora会正式发布。消息一出,网友们沸腾了。奥特曼也提前预热,称AGI将在2025年实现!
抢疯了!马斯克找老黄加价插队拿显卡——为了加速xAI产品研发。
DeepMind大模型再登上Nature——
豆包代码大模型,不小心给曝光了!
上个月底,NeurIPS 官方公布了 2024 年度时间检验奖,而且破天荒地同时颁给了两篇论文。
视频生成模型评测权威榜单VBench,突遭“屠榜”。
ChatGPT,OpenAI推出的文本生成型AI聊天机器人,自2022年11月问世以来便风靡全球。起初,它仅是一个通过简短文本提示撰写文章和代码的生产力提升工具,现已发展成为被超过92%的《财富》500强企业使用的庞然大物。
多知12月4日消息,Teachy,一家总部位于巴西的人工智能教育平台,获得了由Goodwater Capital和Reach Capital领投的700万美元A轮投资。这笔资金是“全球南部”地区,包括拉丁美洲、亚洲和非洲在内的首批以人工智能为重点的投资之一。
刷屏小红书、抖音的AI生图工具,什么来头?
AI音频的价值被持续挖掘。
在人类个体能力提升过程中,当其具备了基本的技能之后,会自主地与环境和自身频繁交互,并从中获取经验予以改进。大模型自我进化研究之所以重要,正是源于该思想,并且更倾向于探究大模型自身能力的深度挖掘和扩展。