CVPR'26 | 以机器人为中心的ToM推理框架,从心智推理到决策行动
CVPR'26 | 以机器人为中心的ToM推理框架,从心智推理到决策行动吉林大学&微软亚洲研究院等团队提出MindPower框架,让机器人像人一样理解他人想法并主动帮忙,构建了首个以机器人为中心的心智推理评测体系,通过六层推理链条,让AI不仅看懂场景,更能推断意图、做出决策、执行动作,显著提升助人能力。
搜索
吉林大学&微软亚洲研究院等团队提出MindPower框架,让机器人像人一样理解他人想法并主动帮忙,构建了首个以机器人为中心的心智推理评测体系,通过六层推理链条,让AI不仅看懂场景,更能推断意图、做出决策、执行动作,显著提升助人能力。
当 Transformer 席卷计算机视觉领域,高分辨率图像、超长序列任务带来的算力与显存瓶颈愈发凸显:标准 Softmax 注意力的二次复杂度,让 70K+token 的超分辨率任务直接显存爆炸,高分辨率图像分割、检测的推理延迟居高不下。
老黄:科技公司的算力焦虑,有 1 万亿刀那么大。北京时间今天凌晨两点,英伟达 GTC 大会在加州圣何塞正式召开,这回的 Keynote 注定要被各大公司 CEO 不断引用了。
一睁眼!陈天桥带队的大模型黑马MiroMind再度满血归来—— 正式发布新一代重型推理智能体:MiroThinker-1.7和MiroThinker-H1。
DeepRead让AI像人一样阅读文档:利用OCR识别章节结构,先精准定位相关段落,再完整读取上下文,避免碎片化检索。实验显示,其长文档问答准确率提升17%,能自动跳过冗余信息,精准提取财报、论文等复杂内容,无需额外知识图谱,轻量高效。
我们推出GLM-5-Turbo——一个面向OpenClaw龙虾场景深度优化的基座模型。 体验过OpenClaw的用户都有一个共同感受:模型能聊好天,但未必能干好活。问题的根源不在框架,而在底层模型本身
上周带大家 0.83 拿下了 GPT Team,后台好多人问我,这个会员能不能变成 API 来用。答案是可以的,而且玩法比你想的多得多。今天这篇就手把手教你怎么搞定,全程跟着做就行,不需要什么技术基础。
全网都在养龙虾,但龙虾最大的痛点不是不够聪明,而是「失忆」。TiDB联合创始人兼CTO黄东旭(dongxu)一周前发布了mem9.ai——一个免注册、开箱即用的永续记忆服务,一经发布直接引爆开发者社区。
你随手拍下一张照片,AI也许只会夸“真好看”,却说不出一句真正有用的建议。
先提前预告下,这个项目解决不了不赚钱的问题,但能帮助减少冲动交易,解决信息搜集、分析效率低问题。当然,也有同事吐槽,这是个韭菜RL,大家有选择地参考与批判一下就好。