突破三维感知瓶颈:魔芯科技发布VGGT系列成果,实现动态高保真重建并获新一轮融资
突破三维感知瓶颈:魔芯科技发布VGGT系列成果,实现动态高保真重建并获新一轮融资在迈向通用人工智能(AGI)的过程中,世界模型被视为让机器理解物理规律、实现空间智能的关键。而高效、鲁棒和精准的三维感知能力,被广泛认为是世界模型的首要前提。通常来说,一个成熟的世界模型需要具备三大核心能力:对长时空序列的持续记忆、对复杂动力学的因果解耦、以及对高清物理细节的精细感知。
搜索
在迈向通用人工智能(AGI)的过程中,世界模型被视为让机器理解物理规律、实现空间智能的关键。而高效、鲁棒和精准的三维感知能力,被广泛认为是世界模型的首要前提。通常来说,一个成熟的世界模型需要具备三大核心能力:对长时空序列的持续记忆、对复杂动力学的因果解耦、以及对高清物理细节的精细感知。
加入Meta近一年——也被争议了快一年,亚历山大王(Alexander Wang)首次出来公开回应一切!
Claude深陷「角色混淆」Bug,分不清自己的话与用户指令,长上下文成了降智「重灾区」。
能解决 AI 焦虑的,唯有热爱。
2026 年 5 月 6 日,Menlo Ventures 合伙人 Deedy Das (@deedydas) 发布了他自 2025 年 11 月以来不断收集的市场版图,帖子很短,但名单很长,核心数据如下:
上个月我遇到一个挺尴尬的事。同事指着屏幕上一张零件截图问我:"这个法兰盘,外径多少,孔位怎么分布的?"我张嘴比划了半天,最后打开SolidWorks重新画了一遍给他看。明明脑子里是完整的三维造型,传到另一个人那里就变成了一堆说不清的数字和手势。
Cursor 正式接入 Claude Opus 4.7 Fast mode——同一个旗舰模型,拆出两个速度档。快 2.5 倍,贵 6 倍,输出价每百万 token 150 美元。最离谱的是,Cursor 官方在发布当天就建议:多数任务请用标准速度。
把 Agent 从单体,组成一支可以协作的 Agent Teams。
奥特曼不买芯片,只租未来。AMD股价翻倍、英伟达深度绑定,如今Cerebras也乖乖奉上50亿认股权证——硅谷新领主,正在悄然对全行业征税。
针对生成式检索范式在电商搜索场景下面临的复杂查询理解不足、用户潜在意图挖掘乏力、奖励系统易过拟合历史窄偏好等落地瓶颈,快手技术团队在已规模化部署的工业级生成式搜索框架 OneSearch 基础上,发布了一篇系统性升级的研究论文,正式推出新一代框架 OneSearch-V2。
I²B-LPO 是一个面向 RLVR 后训练的探索增强框架,通过改进 rollout 策略引导模型生成更多样化的推理轨迹,将探索行为从 “重复采样” 推进到 “在关键节点生成更具区分度的推理轨迹”,在多个数学基准上同时提升准确率与语义多样性,最高分别达 5.3% 和 7.4%。该工作接收于 ACL 2026 Main,来自阿里达摩院 - 智能决策团队。
Z Potentials独家获悉,清华系具身智能公司灵御智能宣布完成天使+轮近亿元人民币融资。本轮融资距离上次融资仅有两个月,由福田资本领投,力合创投、金沙江联合资本、复利多、楹辉创投、华仓资本跟投,老股东英诺基金、天鹰资本持续加注。Maple Pledge枫承资本长期出任公司私募股权融资顾问。
今天一早,我去了北京国家会议中心,参加百度Create 2026 AI开发者大会-超级个体主论坛。
今天早上,OpenAI突然宣布一个促销政策:未来 30 天内,企业用户如果迁移到 Codex,2 个月免费 Codex 用量。同期,桌面端还内置了迁移工具,可以把 Claude Code 的 system prompts、custom skills、chat history、MCP server 配置一键搬过来。
这款 AI 工具名为 RetinaMind,利用视网膜图像训练 AI 模型,以百分比形式呈现对视网膜图像的置信度,通过这样的方式在疾病早期对 ASD 以及 ADHD 进行识别和诊断,准确率达 89%。不仅如此,该工具还可以帮助分析疾病基因机制(如 ABCA4)的潜在变化。
GPT-5.5才发三周,5.6内部测试代码就被抓包了!OpenAI即将祭出Codex 3倍速的「超极速模式」,这种疯狂的迭代速度,简直不给同行留活路。
近日,浙江省杭州市中级人民法院披露了一起涉及某社交平台AI批量代写“种草笔记”典型案例,也是全国首例涉及AI代写“种草笔记”案件。据介绍,原告是知名社交平台的经营者,该平台规则和平台公约均强调要真实体验和经历分享,被告B公司和C公司共同运营一款AI写作工具,该工具可定向为用户提供上述社交平台风格的种草文案、旅游攻略等内容的一键生成服务,并诱导用户发布文案到该社交平台。
澳洲牧羊大叔随手写的三行bash,11天内被OpenAI、Anthropic和Hermes集体收编了。
AI工具最残酷的检验场,不在硅谷,而在义乌。
一篇让你看懂的AGenUI开源解读
微信现支持一键转发百条消息到元宝。
凌晨 1 点,某三甲医院急诊科,一位 62 岁的男性被紧急送入,他正经历急性 STEMI 并发急性心衰。血压飙至 185/105 mmHg,血氧仅 91%。护士已推来除颤仪,催促医生「心电捕手」确认替格瑞洛剂量。
一位网友准备退订机票,为了省事,他直接询问了AI助手“豆包”退票的手续费标准。AI信誓旦旦地告诉他:“手续费只有5%”。这位网友信以为真,果断点击了退票。然而结算时他才发现,真实的退票费高达40%,直接被扣了600多块钱。
DAA:智能体时代的新价值逻辑。
这两天打开X,发现一个开源项目刷屏了——Hyperframes。GitHub上两天干了17.4k star,1.6k fork,Codex、Cursor、Claude Code的插件全线覆盖。
就在刚刚,蚂蚁集团旗下具身智能公司灵波科技传出新动作—— 全面开源其具身基座模型LingBot-VLA的真机后训练工具链。
您有没有想过:在代码Agent里,执行终端命令、跑测试、读报错、总结日志这种任务,用Claude Opus、Claude Sonnet、GPT-5.3-Codex这类昂贵Token的大模型来执行,是不是有点浪费?一定要这么做吗?
一群人,一群 AI,一起玩。
当下的大模型后训练(Post-training)pipeline 中,On-Policy Distillation(OPD)已经成为了明星技术。从 Qwen3、MiMo 到 GLM-5,业界纷纷采用 OPD 并报告了巨大的性能提升。相比于强化学习(RL)稀疏的结果奖励,OPD 提供了密集的 Token 级别监督信号,看起来就像是一顿「免费的午餐」。
“做应用”这件事,现在真的老少咸宜了: 一个二年级小朋友,做了个“拼伞小程序”和操作系统。