阿里首个世界模型:快乐…生蚝
阿里首个世界模型:快乐…生蚝就在刚刚,成立恰满一个月的阿里ATH(Alibaba Token Hub)事业群,发布全球首个主动式实时交互的世界模型产品。名也挺有趣的,叫HappyOyster(快乐生蚝)。HappyOyster搭载原生多模态架构,背后是支持多模态输入与音视频联合生成的流式生成世界模型,核心主打漫游(Wander)、导演(Direct)、创造(Create)、分享(Share)。
就在刚刚,成立恰满一个月的阿里ATH(Alibaba Token Hub)事业群,发布全球首个主动式实时交互的世界模型产品。名也挺有趣的,叫HappyOyster(快乐生蚝)。HappyOyster搭载原生多模态架构,背后是支持多模态输入与音视频联合生成的流式生成世界模型,核心主打漫游(Wander)、导演(Direct)、创造(Create)、分享(Share)。
Claude Opus 4.7,如期而至!比起上手实操,更重磅的是,Claude Opus 4.7「系统级提示词」今天被泄露了!GitHub上放出的内容详尽到,一眼都划不到头。
现象级AI视频技术、字节Seedance 2.0在arXiv发论文了。晒了26页的Benchmark,和贡献者名单。170位团队成员全公开,署名和尊重都拉满了,不过嘛这就不怕……嘛?
今天凌晨,Physical Intelligence发布了全新的VLA模型π0.7,狠狠敲了世界模型一记闷棍。π0.7第一次在机器人领域证明了Compositional Generalization(组合泛化),且VLA。
千呼万唤!终于……龙虾的风也是吹到了AI4S。我最近新挖到的科研神器——紫东太初ScienceClaw。第一次注意到它,还是因为它的“国家队”背景——紫东太初,由中国科学院自动化研究所孵化。
太震撼了!这张图片,不是诞生在地面的机房里,而是来自数百公里之外的太空。它是被一颗卫星「算」出来的。原来,人类的计算能力,真的开始往天上长了。
你的电脑长出了第二个光标了!OpenAI重磅更新Codex,AI能在后台自己开模拟器、修Bug,完全不耽误你前台工作。一代「赛博牛马」正式觉醒。
Claude 4.7才刚发布就遭全网吐槽:太拉跨了!价格贵了50%,却更懒更爱撒谎,做计算密集型任务时充满了不易察觉的危险幻觉。老用户集体崩溃了:快还我4.6!
今日,群核科技(00068.HK)正式挂牌上市,报20.70港元,较发行价上涨171.65%。群核科技董事长黄晓煌在致辞中提到:
香港城市大学朱宗龙、曾晓成团队给出了终极终结方案。他们首创了一套AI驱动的自动化闭环研发平台。从2万个分子的“大海捞针”,到自动化机械臂精准制备,再到AI实时反馈调整,全程无需人类插手。
独家获悉, 亲密交互人形机器人公司Somnia Lab已完成近千万美元天使轮融资,并计划于近期启动 Pre-A 轮融资。长期来看,Somnia Lab的目标并不只是打造一款人形机器人,而是推动人类文明进入人与机器协作、共生、共存的新阶段
到2026年4月,王铭已迅速完成了两轮融资。首轮由云时资本领投,第二轮华控资本领投、云时资本跟投,两轮融资总计近亿元。与此同时,第一款产品Moras 三月已在TikTok美区启动第一批测试。
就在今天,OpenAI正式宣布推出GPT-Rosalind,一款专为生物学和药物研发打造的垂直领域推理模型!它旨在加速从基础生物学、药物发现到转化医学的整个研究流程,解决新药研发周期长、流程复杂等核心痛点。
具身智能领域论文被引次数最高的华人学者,带着十七年海外积淀,回来了。
刚刚,Anthropic 发布 Claude Opus 4.7,已经在 Claude 的所有产品、API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 上全面可用。模型 id claude-opus-4-7
3B激活参数,视觉能力直逼Claude Sonnet 4.5。
2026 年初这几个月,随着 OpenClaw 的爆火,AI 领域也正式步入了 Harness 时代。在这股浪潮中,MiniMax 凭借其敏锐的技术嗅觉,成为了这场变革中的一大核心焦点。
具身智能的Scaling Law停滞了吗?
Gemini 终于推出桌面客户端了!除了能做网页端的一切,它的杀手锏是能捕捉屏幕上所有窗口,突破浏览器限制,把一切都装进模型上下文,帮你解读一切。
养虾已经成为我们团队的日常了,几乎人手都有一只🦞要养,不仅能实时抓取全网前沿 AI 资讯速递,还能干一些搬砖杂活。
「人红是非多」,Hermes Agent 最近真的火了,一边是 GitHub 积累了超过 8 万星,增长趋势完全是直线上升。
视频世界模型跑久了容易“散架”——要么人不动了,要么场景崩了。
最近Hermes agent被讨论得沸沸扬扬的,今天,我们来深度拆解下它是怎么做Skills 闭环系统的。
很多人以为,给Agent装上更多Skill,它就会变得更强。
Agent 的持续学习和自我进化是最近行业内的讨论热点。
大模型写代码这件事,越来越像「既能写片段,又离真实工程差一截」。
本文是北京大学彭宇新教授团队在视觉定位方向的最新研究成果,相关论文已被顶级国际期刊 IEEE TPAMI 接收。为视觉定位模型赋予「自知之明」能力 —— 通过自监督的关联校正与验证模块,在训练过程中动态识别、衰减并纠正错误的监督信号。大量实验证明,让模型学会「自我纠错」,是突破弱监督视觉定位瓶颈的有效途径。
AI模型只看了一串纯数字序列,就能继承另一个模型的危险偏好,即使删掉敏感词没有用,合成数据时代最隐蔽的安全裂缝,被撕开了。
最近沉迷 VibeCoding 哎嘿,做了非常多有意思的小工具,工具太多也还没来得及整理,等有时间再分享下。
有这样一种 “模型玄学”:明明是同一个 Prompt,仅仅换一种说法,模型的回答可能就天差地别。