给机器人装安全护栏,北航联合团队提出RoboSafe,让具身智能体在物理世界中安全行动
给机器人装安全护栏,北航联合团队提出RoboSafe,让具身智能体在物理世界中安全行动当大模型开始控制机械臂、家用机器人时,“安全”这件事也变得不一样了。
搜索
当大模型开始控制机械臂、家用机器人时,“安全”这件事也变得不一样了。
前两天有朋友问我:你的 Agent 现在能干嘛? 我说我的 Agent 会自己赚钱了🐶。 他说,你就吹牛吧。 我把电脑屏幕转过去给他看。上面是我的开源产品 Wesight 推过来的实时进度,我的 Agent 正在 ClawHunt 上竞标,刚刚又中了一单😄。
AI 正在学着操作电脑。由清华大学计算机系博士团队创立的非十科技,最近发布了一款桌面 Agent 产品 ———Agivar。与多数产品试图优化 Prompt 不同,它选择从另一个方向切入:让 AI 主动学习用户的工作流程。
从写指令,到给目标,再到只给一句意图:有人干脆让Codex自己定任务——人类还能留在编程的计划层吗?
过去很长一段时间里,AI 行业衡量模型进步的方式都相当直观:参数更大、榜单更高、推理更强、上下文更长。每一次模型发布,行业都会盯着数学、代码、知识问答和多模态基准测试,看它是否又向通用智能迈近了一步。
新智元近日对话了清华大学教授沈阳。作为长期关注 AI 应用、智能体与产业实践的学者,同时也是 ZeeLin(智灵动力)首席科学家,他个人每天的Token消耗量近10亿,本次对话围绕「自进化AI的自我递归进化」这一主线展开,讨论 AI 自进化与科研、叙事、商业与AGI相关的十个话题。
近日,全球领先的具身自主科研智能基础设施提供商,深圳津渡生物医学科技有限公司(以下简称“津渡生科”)宣布完成近亿元A轮融资,本轮融资由高特佳投资领投,指数资本担任独家财务顾问。融资资金将重点用于深化物理AI(Physics-AI)底层架构研发、BioFord Agent科研智能体平台的迭代升级及全球市场布局拓展。
当 LLM Agent 处理长期对话、多轮交互和复杂文档时,Memory 已经成为不可或缺的核心模块。它帮助智能体保存历史、检索信息、维持个性化上下文,并支撑跨时间的推理能力。
最新测试显示,模型抱团后实力明显升级:Opus 4.8+GPT-5.5>Fable 5;Kimi K2.6+ DeepSeek V4 Pro+Gemini 3 Flash=Fable 5。能力追上了,开销还减半。根据官方定价,相比Fable 5,Kimi K2.6+ DeepSeek V4 Pro+Gemini 3 Flash这套平价阵容,成本降幅接近80%。
刚刚,UC伯克利放出了一场号称“智能体最后的考试”的全新基准测试。它把当今最强的AI Agent们拉到考场上,让它们干真正的活——在Siemens NX里建3D模型、在Unreal Engine里搭游戏场景、在Adobe After Effects里做特效合成。