
阿里旗舰推理模型硬刚DeepSeek!官宣独立APP,发布公告AI亲自写
阿里旗舰推理模型硬刚DeepSeek!官宣独立APP,发布公告AI亲自写阿里通义Qwen团队熬夜通宵,推理模型Max旗舰版来了!QwQ-Max-Preview预览版,已在LiveCodeBench编程测试中排名第5,小超o1中档推理和DeepSeek-R1-Preview预览版。
阿里通义Qwen团队熬夜通宵,推理模型Max旗舰版来了!QwQ-Max-Preview预览版,已在LiveCodeBench编程测试中排名第5,小超o1中档推理和DeepSeek-R1-Preview预览版。
去年 8 月,Codeium 完成了由 General Catalyst、Kleiner Perkins 等参与的 1.5 亿美元融资,估值来到 12.5 亿美元,是这些老牌基金在 AI Coding 领域下的重注。之后在 11 月 Codeium 正式发布了 Agentic IDE Windsurf,与 Cursor/Devin 进行差异化竞争。
只用4500美元成本,就能成功复现DeepSeek?就在刚刚,UC伯克利团队只用简单的RL微调,就训出了DeepScaleR-1.5B-Preview,15亿参数模型直接吊打o1-preview,震撼业内。
从代码补全到全流程开发,AI正以前所未有的速度改变软件开发的规则。本文深入解析了L1到L5五个等级的AI编程工具,展望了AI编程的全面自动化。
Cursor、Copilot、 Windsurf、Devin、Bolt.new 等一系列 AI 编程神器经常刷屏程序员圈。可惜,普遍对中文开发者不太友好,我把他们装好后,第一件事儿就是先折腾下汉化。而且时不时因为未知原因就被封号了。终于今天,字节跳动洞察到了这个痛点,发布了一款中文开发者友好的 AI IDE——Trae。虽然是海外版,但支持中文。
AI 编程工具的发展令人目不暇接。从年初 Devin 这款被称为“首个真正的 AI工程师”的产品发布,到年中 Anthropic 在 Claude 3.5 Sonnet 模型推出「Artifacts」功能的重大突破,再到 Cursor、Windsurf 等新一代 IDE 的崛起,AI 正在重塑程序员的工作方式。
DeepSeek版o1,有消息了。还未正式发布,已在代码基准测试LiveCodeBench霸榜前三,表现与OpenAI o1的中档推理设置相当。注意了,这不是在DeepSeek官方App已经能试玩的DeepSeek-R1-Lite-Preview(轻量预览版)。
与 Devin 合作一个月后,这些研究者给出了不太乐观的反馈。
450 美元的价格,乍一听起来不算「小数目」。但如果,这是一个 32B 推理模型的全部训练成本呢?
在 AI 代码领域,Cognition 绝对算得上是个「传奇」。