华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能
华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能“软工任务要改多文件、多轮工具调用,模型怎么学透?高质量训练数据稀缺,又怕轨迹含噪声作弊?复杂 RL 训练成本高,中小团队望而却步?”
“软工任务要改多文件、多轮工具调用,模型怎么学透?高质量训练数据稀缺,又怕轨迹含噪声作弊?复杂 RL 训练成本高,中小团队望而却步?”
这正是动画制作的过程,当它第一次出现时,人们对它产生了反感。现在的 AI 发展情况与之非常相似,但技术的发展是无法阻挡的,它必然会发生。你要么成为其中的一部分,要么被时代淘汰。
近年来,视频扩散模型在 “真实感、动态性、可控性” 上进展飞快,但它们大多仍停留在纯 RGB 空间。模型能生成好看的视频,却缺少对三维几何的显式建模。这让许多世界模型(world model)导向的应用(空间推理、具身智能、机器人、自动驾驶仿真等)难以落地,因为这些任务不仅需要像素,还需要完整地模拟 4D 世界。
“纯做AI工具的创业时代已经结束了,2026年是按效果付费的元年。”
深夜,梁文锋署名的DeepSeek新论文又来了。这一次,他们提出全新的Engram模块,解决了Transformer的记忆难题,让模型容量不再靠堆参数!
256K文本预加载提速超50%,还解锁了1M上下文窗口。
现在,我们越来越多地将大语言模型应用于搜索、编程、内容生成和决策辅助等现实场景中。尽管每天有数百万人使用大模型,但它的问题也随之而来,例如有时会产生幻觉,甚至在特定情境下表现出误导或欺骗用户的倾向。
今天一早,数码博主 @智慧皮卡丘透露了关于 OpenAI「To-go」硬件项目的最新细节。该硬件已被确认是一款取代 AirPods 的特殊音频产品,内部代号为「Sweetpea」(香豌豆)。
近日,由阿里钉钉最年轻的副总裁王铭创立的攀峰智能(K2 Lab)宣布完成数千万元的种子轮融资,由云时资本独家投资,心流资本FlowCapital担任长期财务顾问。本轮融资资金将主要用于产品和AI能力打造、用户增长和AI Native团队的加速构建,快速推进全球首个面向超级个体的内容电商Agent基建。
一觉醒来,你的 iPhone 即将用上最强 AI 了。就在刚刚,苹果和 Google 发布联合声明,双方达成达成多年深度合作协议。下一代「苹果基础模型」将直接基于 Google 的 Gemini 模型和云技术构建。