DeepSeek-R1 是怎么训练的|深度拆解
DeepSeek-R1 是怎么训练的|深度拆解昨天晚上,DeepSeek 又开源了 DeepSeek-R1 模型(后简称 R1),再次炸翻了中美互联网: R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。 R1 上线 API,对用户开放思维链输出 R1 在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版,小模型则超越 OpenAI o1-mini
搜索
昨天晚上,DeepSeek 又开源了 DeepSeek-R1 模型(后简称 R1),再次炸翻了中美互联网: R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。 R1 上线 API,对用户开放思维链输出 R1 在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版,小模型则超越 OpenAI o1-mini
中国版o1刷屏全网。DeepSeek R1成为世界首个能与o1比肩的开源模型,成功秘诀竟是强化学习,不用监督微调。AI大佬们一致认为,这就是AlphaGo时刻。
据 TechCrunch 报道,OpenAI 可能即将发布一款 AI 工具,可以控制用户的电脑并代表用户执行操作。
今天给大家分享一下2024年中国AIGC应用发展年度大报告。QuestMobile数据显示,截止到2024年12月,AI原生APP月度活跃用户已经突破1.2亿,同比增长232%,同时,用户粘性也持续增长,整体月人均使用时长达133.0分钟,月人均使用次数也达到49.6次。
AI生图热潮下,技术与艺术正在不断碰撞中擦出新火花。人们对于生成效果和创意的要求都在悄然提升,同时也开始更加注重其中的实用性与持续性,而非只是单纯的娱乐体验。
设想一场高度智能的模拟游戏,游戏的角色不再是普通的NPC,而是由大语言模型驱动的智能体。在这其中,悄然生出一个趣事——在人类的设计下,这些新NPC的言行不经意间变得过于啰嗦。
李继刚在消失半年后,带着汉语新解重新归来,一出手大家就惊呼李继刚的prompt已经到了next level。但不懂编程的小白又懵逼了!怎么提示词也开始编程了?大语言模型的优势不是通过说话就能达成需求吗?怎么又开始需要编程了?技术在倒退吗?
Grok AI 最近网页版刚刚上线。我看到不少人都在比较 Grok 对标 ChatGPT 等等 LLM 大模型的研究和生成能力。我想说,背靠 X (前推特)数据库的 Grok AI,最好的使用方式难道不是实时监测全球媒体热点吗?
初创公司DeepWriter宣布:世界第一部完全由AI写作的10万字商业竞争书籍诞生了!全程没有人类参与工作,不到4小时,即可完成约10万单词的商业书籍创作。
Cursor、Copilot、 Windsurf、Devin、Bolt.new 等一系列 AI 编程神器经常刷屏程序员圈。可惜,普遍对中文开发者不太友好,我把他们装好后,第一件事儿就是先折腾下汉化。而且时不时因为未知原因就被封号了。终于今天,字节跳动洞察到了这个痛点,发布了一款中文开发者友好的 AI IDE——Trae。虽然是海外版,但支持中文。
如果我们打开阿里的招聘官网,可以发现通义To C的一些招聘细节。在“智能信息”这个事业板块搜索与“通义”相关的可以看到总共有六个岗位,初步发布时间刚好就是去年年底通义To C分拆这一消息刚传出来的时候:
特朗普2.0政府即将开启,科学界又将迎来「几家欢喜几家忧」的变动局面。AI与太空探索成最大赢家,环境气候科学或将再次被特朗普抛弃。
ittor Geometric 1.0是由中国人民大学与东北大学联合开发的图机器学习库,基于国产Jittor框架,高效灵活,可助力处理复杂图结构数据,性能优于同类型框架,支持多种前沿图神经网络模型,已开源供用户使用。
来了来了,月之暗面首个「满血版o1」来了!这是除OpenAI之外,首次有多模态模型在数学和代码能力上达到了满血版o1的水平。
2024一整年,各大科技厂商经历了对RayBan Meta的“质疑-理解-成为-超越”,在AI眼镜领域集结重兵。整个市场也从RayBan Meta的“一枝独秀”,变成了近百家企业参与、数十款新品被推出的火爆局面。
AI具备的能力,本质上来自算法和训练大模型所用的数据,数据的数量和质量会对大模型起到决定性作用。此前OpenAI工作人员表示,因没有足够多的高质量数据,Orion项目(即GPT-5)进展缓慢。不得已之下,OpenAI招募了许多数学家、物理学家、程序员原创数据,用于训练大模型。
Open AI CEO:今年人类会见到第一批就业的“AI智能体”
就在刚刚,豆包的超级实时语音全量上线了。
OpenAI正在内部测试其全新「Operator」功能,标志着AI即将从被动助手转变为主动解决问题的超级智能体。预计这些智能体能独立完成从软件开发到复杂财务分析等任务,革命性地替代人类在多个领域的工作。
网友盛赞“最有用的大模型应用”,小红书AI翻译功能上线了!(Doge)
2025,人形机器人量产元年。
榜单标题:2024年12月全球AI应用流量榜单
AI 编程工具的发展令人目不暇接。从年初 Devin 这款被称为“首个真正的 AI工程师”的产品发布,到年中 Anthropic 在 Claude 3.5 Sonnet 模型推出「Artifacts」功能的重大突破,再到 Cursor、Windsurf 等新一代 IDE 的崛起,AI 正在重塑程序员的工作方式。
用 AI 搞创作,还能有什么新奇的玩法?两个月前,李彦宏发布了新的 AI 创作工具「自由画布」,据说将在文库和网盘联合上线。 但体验了 1.0 版本后 APPSO 认为,和预期得很不一样:一点也不麻烦,非常能干,甚至还解决了我长期以来的烦恼。哪些烦恼呢?
欧莱雅与IBM正在合作开发一款定制化的生成式人工智能(GenAI)模型,旨在加速化妆品配方流程,进一步拓展生成式AI在个人护理市场的应用版图。 IBM表示,这款定制AI工具将“显著提升欧莱雅研发团队在各个化妆品品类和全球市场的性能表现与消费者满意度”。
近期关于 scaling law 的讨论甚嚣尘上,很多观点认为 scale law is dead. 然而,我们认为,高质量的 “无监督” 数据才是 scaling law 的关键,尤其是教科书级别的高质量的知识语料。此外,尽管传统的语料快枯竭了,但是互联网上还有海量的视频并没有被利用起来,它们囊括了丰富的多种模态的知识,可以帮助 VLMs 更好好地理解世界。
在科技飞速发展的当下,AI如汹涌浪潮席卷而来。从认知过载到焦虑情绪,AI催生了一种新型的「疲劳症」。
如果2023年给大模型的关键词是席卷,那么在2024,这个关键词应该是渗透。最常用的软件、手机PC本身、甚至厨卫/电源开源,都在被AI重塑。主观感受中,这一年,AI更加强大,以前所未有的速度嵌入各行各业。
OpenAI o3还没上线,就被曝数学成绩是靠作弊得来?!Benchmark发布机构内部人员爆料称,OpenAI给了他们经费赞助。就连包括陶哲轩在内参与出题的60余名数学家,在消息曝光之前也都和普通公众一样蒙在鼓里。
不知道还有多少人记得那场发布会。