实测丨全新的「扣子编程」,全新的 Vibe Infra
实测丨全新的「扣子编程」,全新的 Vibe Infra老粉都知道,咱们特工宇宙和扣子团队有多熟悉。
老粉都知道,咱们特工宇宙和扣子团队有多熟悉。
“我希望留下一个能被世界铭记的作品。”
应「知乎AI中场时刻」邀约,来做个年终回顾
Agent成下一代技术主体,如何为其“修路架桥”?
MiniMax最新旗舰级Coding & Agent模型M2.1,刚刚对外发布了。这一次,它直接甩出了一份硬核成绩单,在衡量多语言软件工程能力的Multi-SWE-bench榜单中,以仅10B的激活参数拿下了49.4%的成绩,超越了Claude Sonnet 4.5等国际顶尖竞品,拿下全球SOTA。
AI 也要来帮你总结过去的一年了! 今年,ChatGPT 官方首次上线了名为「Your Year with ChatGPT」的年度回顾功能。 谁能领取这份年度报告? 目前,这项功能主要面向美国、英国、加拿大、新西兰和澳大利亚,且运行最新版本 ChatGPT 应用的用户推出。
抽奖式的生图体验,确实让很多设计师在尝鲜之后又默默打开了 Photoshop。于是乎,阿里千问团队再次出手,开源了一个叫 Qwen-Image-Layered 的模型,试图从底层逻辑上解决这个问题。
《晚点 LatePost》独家获悉,火山引擎将成为 2026 年中央广播电视总台春节联欢晚独家 AI 云合作伙伴,字节跳动旗下的智能助手豆包也将配合上线多种互动玩法,抖音曾于 2019 年与 2021 年两次成为春晚的独家互动平台。
12 月 19 日,Cursor 宣布将收购代码评审初创公司 Graphite。Graphite 聚焦于代码完成之后的流程,帮助团队评审变更、判断代码是否已具备上线条件。Graphite 联合创始人 Tomas Reimers 与 Cursor CEO Michael Truell 的共识是:“AI 的引入意味着会有更多代码被写出来,也就必然意味着,需要被评审的代码只会更多。”
我真栓Q了!围观了场狼人杀,看得我汗流浃背……
AI 钉钉 1.1,不仅仅是一个 0.1 版本更新。
知名AI 科学家LeCun周四证实, 他已创办一家新创企业 ——这是科技界人尽皆知的秘密——但他表示不会以首席执行官身份运营这家新公司。
参数越小,智商越高?Gemini 3 Flash用百万级长上下文、白菜价成本,把自家大哥Pro按在地上摩擦。谷歌到底掏出了什么黑魔法,让整个大模型圈开始怀疑人生?
ChatGPT 现在可以由用户主动调整热情程度,例如更加温和体贴和使用更多表情符号等。新个性化选项包括温和体贴、热情洋溢、标题列表和表情符号,用户可以在个性化设置中主动控制这些选项例如减少或增加使用表情符号等。
来猜一下,AI时代,医生最哭笑不得的是什么?
最近这段时间,谷歌DeepMind的官方纪录片《The Thinking Game》在AI圈传播挺广。
抢夺AI交互入口,加快AI眼镜普及。
前段时间,跟豆包一拍即合。
现有的视频编辑模型往往面临「鱼与熊掌不可兼得」的困境:专家模型精度高但依赖 Mask,通用模型虽免 Mask 但定位不准。来自悉尼科技大学和浙江大学的研究团队提出了一种全新的视频编辑框架 VideoCoF,受 LLM「思维链」启发,通过「看 - 推理 - 编辑」的流程,仅需 50k 训练数据,就在多项任务上取得了 SOTA 效果,并完美支持长视频外推!
毋庸置疑!2025年title属于「Agent元年」。
生成式AI狂奔三年,2025迎来架构创新的大年,三条脉络交织演进,伴随着Scaling law(规模定律)遇到天花板的争议,开始定义AI进化的新范式。
近日,在与数学家Hannah Fry的对话中,DeepMind CEO Demis Hassabis回顾了AI在过去一年的飞跃式进展,他谈到了「参差智能」、持续学习、模型幻觉等迈向AGI过程中的关键挑战,并提到AGI带来的社会冲击可能是工业革命的10倍。
在多智能体系统的想象中,我们常常看到这样一幅图景: 多个 AI 智能体分工协作、彼此配合,像一个高效团队一样攻克复杂任务,展现出超越单体智能的 “集体智慧”。
为什么Agent在演示时无所不能,到了实际场景却频频拉胯?
2025倒计时,新SOTA模型涌现没有放缓迹象。一夜之间,编程SOTA模型易主,而且上线即开源,依然来自中国大模型公司——智谱AI,GLM-4.7。
AI游戏的“空间”新方向。一天三变的 AI 圈,新技术的涌现仍然在催生无数个新方向。比如茶馆君最近在小红书上发现了一款名为《森盒》的游戏。他们凭借一个“AI 装修”的核心玩法受到了用户的追捧,从今年上半年在小红书、抖音等平台走红,不断量产数万赞的爆款笔记。截至目前已经在全网收获了超过百万的粉丝。
除了英特尔和AMD,现在我们终于可以选择国产笔记本电脑显卡了!这款显卡的背后,饱含着中国工程师们日夜攻坚的汗水与泪水。
倒反天罡! Gemini 3 Flash的表现在SWE-Bench Verified测试中获得了78%的分数,比超大杯Pro还略胜一筹。
要说这两天AI圈最火的一条消息,莫过于MiniMax正式通过港交所聆讯,即将冲刺IPO。