
追问weekly | 过去两周,AI领域有哪些新突破?Vol.68
追问weekly | 过去两周,AI领域有哪些新突破?Vol.68软银400亿美元豪赌OpenAI:远见卓识还是泡沫顶峰?
软银400亿美元豪赌OpenAI:远见卓识还是泡沫顶峰?
据最新消息,AI六小虎之一的月之暗面即将推出其首个AI内容社区产品,目前正在进行小范围灰度测试,预计本月底正式上线。这款产品经历了长达半年的内部孵化和打磨,是公司在AI战略上的最新尝试。
有在离谱。 高分论文因为没有引用先前的研究而被ICLR拒稿了?!
在游戏开发中,独立开发者往往就像一个“全能战士”,既要当程序员,又要当策划,还得懂美术和运营。
RTP-LLM 是阿里巴巴大模型预测团队开发的高性能 LLM 推理加速引擎。它在阿里巴巴集团内广泛应用,支撑着淘宝、天猫、高德、饿了么等核心业务部门的大模型推理需求。在 RTP-LLM 上,我们实现了一个通用的投机采样框架,支持多种投机采样方法,能够帮助业务有效降低推理延迟以及提升吞吐。
这一创新背后既有战略布局的深意,同样还暗藏诸多挑战。
来自国内的光电混合芯片技术,登上最新顶刊Nature!
自主通才科学家的 5 个层级。
随着 OpenAI o1 和 DeepSeek R1 的爆火,大语言模型(LLM)的推理能力增强和测试时扩展(TTS)受到广泛关注。然而,在复杂推理问题中,如何精准评估模型每一步回答的质量,仍然是一个亟待解决的难题。传统的过程奖励模型(PRM)虽能验证推理步骤,但受限于标量评分机制,难以捕捉深层逻辑错误,且其判别式建模方式限制了测试时的拓展能力。
阿里巴巴可能看清楚了,自我迭代,不仅是靠用户价值和创业精神的回归,更需要的,是一场生产力革命。
从 ChatGPT 引发认知革命到 GPT-4o 实现多模态跨越,AI 技术的每次跃迁都在印证一个底层逻辑 —— 数据质量决定智能高度。而今,这场 AI 浪潮正在反哺数据库领域,推动其从幕后走向台前,完成智能时代的华丽转身。
这家科技巨头通过昼夜奋战、大举裁员以及非常规手段,实现了技术代差的快速弥合。
今天早些时候,著名研究者和技术作家 Sebastian Raschka 发布了一条推文,解读了一篇来自 Wand AI 的强化学习研究,其中分析了推理模型生成较长响应的原因。
赚钱嘛,不寒碜!
研究发现,推理模型(如DeepSeek-R1、o1)遇到「缺失前提」(MiP)的问题时,这些模型往往表现失常:回答长度激增、计算资源浪费。本文基于马里兰大学和利哈伊大学的最新研究,深入剖析推理模型在MiP问题上的「过度思考」现象,揭示其背后的行为模式,带你一窥当前AI推理能力的真实边界。
近年来,随着大型语言模型(LLMs)的快速发展,多模态理解领域取得了前所未有的进步。像 OpenAI、InternVL 和 Qwen-VL 系列这样的最先进的视觉-语言模型(VLMs),在处理复杂的视觉-文本任务时展现了卓越的能力。
近日,一场关于 OpenAI 未来走向的激烈纷争正在上演。4 月 11 日,12 名 OpenAI 前员工联合提交了一份法律简报,明确表态支持埃隆·马斯克对 OpenAI 提起的诉讼,这场诉讼的核心在于 OpenAI 从非营利组织向营利性实体的转型。
国家队。
2025年2月,商汤医疗宣布了分拆后的第一笔融资,投前估值15亿元。
连续创业者马宇驰,在上一波人工智能大潮中创立三角兽科技,带领公司被腾讯收购,去年重回AI赛道,参与到新一轮大模型应用创业中,2033科技于2024年已经完成天使轮融资,由商汤科技和东方国资共同投资近亿元人民币。
前些天,GPT-4o的多模态生图上线之后,引发全球AI社区广泛的关注,吉卜力图画全网风靡。
GitHub中国区昨日突然访问受限,官方最新回复:只是一个配置失误导致的,现已全面恢复。与此同时,OpenAI推出API「已验证组织」新政,全球开发者想用前沿模型,得先过这关!
招人的风向透露出大厂们在AI上的动向。最近阿里国际传出大幅加码AI人才布局的消息引来关注,再早一点,美团的AI招聘在社交网络上引起不少讨论。
AIMO2最终结果出炉了!英伟达团队NemoSkills拔得头筹,凭借14B小模型破解了34道奥数题,完胜DeepSeek R1。
根据官方介绍,Augment Agent 是首个转为大型代码库工作的专业软件工程师设计的 AI 编码助手,上下文支持 200K ,也就是 20 万的 token 啊。
本想撮合两个NPC结婚,结果其中一人在AI思考下突然辞职流浪,另一个沉迷了炒股!
MCP 传输机制(Transport)是 MCP 客户端与 MCP 服务器通信的一个桥梁,定义了客户端与服务器通信的细节,帮助客户端和服务器交换消息。
MCP 协议定义了一个严格的生命周期,用于客户端-服务器连接,确保了通信双方能进行适当的状态管理和能力协商。
MCP 协议遵循互联网常见的 C / S 架构,即客户端(Client)- 服务器(Server)架构。
代码截图泄露,满血版o3、o4-mini锁定下周!更劲爆的是,一款据称是OpenAI的神秘模型一夜爆红,每日处理高达260亿token,是Claude用量4倍。奥特曼在TED放话:将推超强开源模型,直面DeepSeek挑战。