TPAMI | DC-SAM:打破SAM交互限制,基于循环一致性的图像与视频上下文分割方法
TPAMI | DC-SAM:打破SAM交互限制,基于循环一致性的图像与视频上下文分割方法上下文分割(In-Context Segmentation)旨在通过参考示例指导模型实现对特定目标的自动化分割。尽管 SAM 凭借卓越的零样本泛化能力为此提供了强大的基础,但将其应用于此仍受限于提示(如点或框)构建,这样的需求不仅制约了批量推理的自动化效率,更使得模型在处理复杂的连续视频时,难以维持时空一致性。
上下文分割(In-Context Segmentation)旨在通过参考示例指导模型实现对特定目标的自动化分割。尽管 SAM 凭借卓越的零样本泛化能力为此提供了强大的基础,但将其应用于此仍受限于提示(如点或框)构建,这样的需求不仅制约了批量推理的自动化效率,更使得模型在处理复杂的连续视频时,难以维持时空一致性。
2023 年,当 GPT-4 在美国执业医师资格考试(USMLE)中取得了惊人的高分时,不只是 OpenAI,硅谷都为此喝彩,AI 在医疗上的前景仿佛一片光明。
最新综述首次系统探讨LLM控制机器人的安全威胁、防御机制与未来挑战,指出LLM的具身鸿沟导致其在物理空间可能执行危险动作,而现有防御体系存在逻辑与物理脱节等问题。
「暗涌Waves」独家获悉,AI陪伴公司「自然选择」(Nature Select)已于近期完成新一轮融资,金额超3000万美元。本轮融资由阿里巴巴、蚂蚁集团、启明创投、五源资本、创世伙伴创投、云时资本等机构联合投资。星涵资本为本轮独家财务顾问。
今天,据外媒CNBC报道,两位知情人士透露,北京大模型独角兽月之暗面正在进行新一轮融资,这轮融资对其估值为48亿美元(约合人民币334.13亿元),而仅在20天前公布的C轮融资中其估值还是43亿美元(约合人民币299.32亿元)。
元旦期间,DeepSeek 发布的 mHC 震撼了整个 AI 社区。
马斯克的 xAI 非常神秘。
AI证明数学猜想,这次来真的了。
Claude Cowork 火了,基于本地的 AI Agent 产品突然成为大家关注的重点。
字节跳动的「扣子」在过去两年的「走一步看一步」和不断的「目标横跳」,其实是一个值得 AI 时代产品人研究的宝藏故事。
你可以卖自己的 Skills 了。
想象这样一个日常画面:你吩咐家用机器人「烧壶开水」,它却当场卡壳——水壶在哪?该接自来水还是过滤水?先插电还是先按开关?水开了又该如何判断?这些对人类而言像呼吸一样自然的家务,对过去的机器人却是大大的难题:要么忘了插电,要么找不到水壶,甚至会把柜门把手错当成开关一通乱按。
究竟是什么样的更新,才能让谷歌CEO皮查伊称之为“众望所归”(Answering a top request from our users)?
当巨头疯狂扫货、分析师开始囤iPhone17,你的钱包、电脑和AGI的未来,正在被同一堵看不见的墙悄悄卡住。
清华姚班、普林斯顿博士、前 OpenAI 核心成员、27 岁、首席 AI 科学家……当这些标签堆砌在一个人身上时,你很难不感受到一种来自智商层面的压迫感。
AI时代,电工再次成为香饽饽。
测了一堆AI视频生成工具后,骡子马发现了个真东西——Flova。
Wispr Flow,可以说是在语音输入法中最早出圈、也最具代表性的产品之一。
复盘2025硅谷人才大战:一场席卷32位AI高管的“大迁徙”。
近一年来,如果要在内容行业评选出一匹黑马,AI漫剧无疑会高票当选。
无需真实奖励,哪怕用随机、错误的信号进行训练,大模型准确率也能大幅提升?
两个月前,ICML 2026发布了征稿新规,我们也详细做了报道。
原人工智能大模型公司衔远科技(Frontier.ai)的AI产品负责人 Lyon(李昂),已正式启动新项目 “MIMOS”。与当前市场集中于底层模型研发或垂直应用开发的路径不同,Lyon此次创业将目光投向AI浪潮中更为关键的“产品化”环节,致力于探索连接前沿技术与实际商业价值的系统性方法论。
就在刚刚,人形机器人赛道投下了一颗“开源炸弹”。
扣子2.0,今天正式上线。 2024年2月1日,「扣子」第一次和你见面。我们怀着对 AI 能力的憧憬,在扣子里不断拖拽工作流节点、反复优化提示词,只为真的能把活儿交给AI。 直到今天,扣子已经陪你走过了七百多个日夜,拥有了上千万的用户。
医生的外挂神器来了! 就在今天,阿里健康重磅推出了一款面向医生的AI产品——氢离子。简单来说,氢离子定位为医生版的GPT,已完成内测并开放下载,移动版和网页版均已上线。I
就在刚刚,Anthropic再次引爆硅谷:Claude Cowork被曝注入「永久记忆」!从此,AI不再健忘,而是长出一颗永久的超级大脑。一场AI办公革命,已经离爆发不远了。
昨天,据英国《金融时报》报道,美国AI超级独角兽Anthropic正在进行一轮总额超过250亿美元(约合人民币1742.1亿元)的融资。本轮融资预计将使其估值提升至约3500亿美元(约合人民币24389.0亿元),较去年9月的1700亿美元(约合人民币11846.1亿元)估值实现翻倍。
AI视频生成正从“静态输出”迈入“实时交互”阶段,一场内容创作革命即将到来。 近日,中国儒意宣布以1420万美元对爱诗科技进行战略投资,双方将围绕影视、流媒体、游戏等业务展开深度合作。 爱诗科技作为全
面对《the Big Technology Podcast》抛出的问题,Mistral AI的 CEO Arthur Mensch 表示:大模型肯定会走向商品化,当模型表现越来越接近,那么竞争就不在于模型本身,而在于如何让客户用起来。