如视发布空间大模型Argus1.0,支持全景图等多元输入,行业首创!
如视发布空间大模型Argus1.0,支持全景图等多元输入,行业首创!近来,世界模型(World Model)很火。多个 AI 实验室纷纷展示出令人惊艳的 Demo:仅凭一张图片甚至一段文字,就能生成一个可交互、可探索的 3D 世界。这些演示当然很是炫酷,它们展现了 AI 强大的生成能力。
近来,世界模型(World Model)很火。多个 AI 实验室纷纷展示出令人惊艳的 Demo:仅凭一张图片甚至一段文字,就能生成一个可交互、可探索的 3D 世界。这些演示当然很是炫酷,它们展现了 AI 强大的生成能力。
2024年以来,从苹果Vision Pro将「空间计算」推向巅峰,到Peloton Guide、Nex Playground等「AI摄像头」硬件开始在小规模市场中验证可行性,风口已然初现。
刚刚,创下日本估值新高的AI初创公司诞生了!
在AI时代,一个洛杉矶电影人用AI工具打造出「电影宇宙」——外星格隆人研究人类文明的搞笑伪纪录片,从健身到橄榄球,全是滑稽误解!
OpenAI定义的L3 AI,要被谷歌抢先一步了。
前不久写了一期卡神做的 nanochat ,听朋友说咱们国产早就有类似的开源项目了:miniMind 。
刚刚,一家AI公司的融资引发了圈内热议。
在腾讯四年,朱庆旭曾将多种训练数据喂给具身模型,最终他得出结论:“基于遥操作数据训练的主流方案,有着原理性缺陷。”
「大家严重低估了 Voice 作为 AI 交互界面的潜力。」
“开组会是一场巨大的精神霸凌。”
大家都知道,图像生成和去噪扩散模型是密不可分的。高质量的图像生成都通过扩散模型实现。
周末和几个老同学聚了聚。大家都在互联网行业,聊着聊着话题自然绕到 AI。
在过去两年,大语言模型 (LLM) + 外部工具的能力,已成为推动 AI 从 “会说” 走向 “会做” 的关键机制 —— 尤其在 API 调用、多轮任务规划、知识检索、代码执行等场景中,大模型要想精准调用工具,不仅要求模型本身具备推理能力,还需要借助海量高质量、针对性强的函数调用训练数据。
智能体自进化,阿里开源了新成果。
无需重新训练,也能一键恢复模型的安全意识了。
人类高级视觉皮层在个体间存在显著的功能差异,而构建大脑编码模型(brain encoding models)—— 即能够从视觉刺激(如图像)预测人脑神经响应的计算模型 —— 是理解人类视觉系统如何表征世界的关键。传统视觉编码模型通常需要为每个新被试采集大量数据(数千张图像对应的脑活动),成本高昂且难以推广。
AI正悄悄蚕食整整一代人的入场券。新人难觅岗位,毕业生不得不面对「没有经验就没有工作,没有工作就无法获得经验」的恶性循环。当实验中的AI为「活下去」开口敲诈,人类才真正看见技术失控的阴影。在淘汰一半初级白领与缔造10%增长之间,我们还有多少时间为AI加装护栏?社会命运不能只寄托于几家公司的良知,更需要制度保障。
无需额外训练即可适配预训练生成模型的编辑方法,凭借灵活、高效的特性,已成为视觉生成领域的研究热点。这类方法通过操控 Attention 机制(如 Prompt-to-Prompt、MasaCtrl)实现文本引导编辑,但当前技术存在两大核心痛点,严重限制其在复杂场景的应用
一次「常规更新」搞崩半个地球,Cloudflare CTO紧急谢罪:我们搞砸了!Cloudflare自杀式Bug引发连锁反应,波及全球20%网站。当数百万爬虫撑爆了防御名单,Cloudflare的崩溃揭示了AI时代最深的基建隐忧,人类还能跟得上AI进化的脚本吗?
就在几小时前,Gemini 3.0重磅发布。随着而来的还有其颠覆性的AI原生IDE产品——Antigravity,这不只是一个新工具那么简单。谷歌的这次发布,将三个核心开发工具,AI代理(Agent)、代码编辑器(Editor)和浏览器(Browser) 集成在了一起,构建了由AI驱动、从编码、研究、测试到验证的完整闭环,一举打通了自家的生态。
刚刚,才离开 Meta 不久的 Soumith Chintala 发布了一条推文,盛赞 Thinking Machines Lab(以下简称 TML)的人很了不起(incredible)。与此同时,这位 PyTorch 之父也更新了自己的个人介绍,正式官宣加入 TML,并表示正在这家估值已达 500 亿美元的创业公司「创造新东西(Building new things)」 。
凌晨,谷歌终极杀器Gemini 3重磅来袭,一出手就是Pro顶配版,号称「史上最强推理+多模态+氛围编程」三合一AI战神!基准测试横扫全场,就连GPT-5.1也被斩于马下,AI的下一个时代开启。而且,一上来就是顶配的Gemini 3 Pro——迄今推理最强,多模态理解最强,以及「智能体」+「氛围编程」最强的模型!
就在前两天,深圳一家名为 Inspire Curve 的创企设计出的 AI 概念相机,获得了有“设计界奥斯卡”美誉的 iF 设计奖。从媒体报道给出的信息看,两款产品的共通之处是将 AI 生图模型引入拍摄过程,让用户在 AI 的帮助下,一键“出片”。
人类首个AI创作型导演诞生!Josh Wallace Kerrigan用GenAI工具,构建Neural Viz的外星宇宙,避免硬碰AI短板,转而实验伪纪录片形式。
一年半之前,影眸科技年轻的创始团队去到旧金山,带着还没正式发布的 3D 生成模型 Rodin,在 GDC(游戏开发者大会)上向全球最顶级的游戏开发者们演示 demo。
MiniMax,今年真猛。
文献浩如烟海, 关键信息总藏在检索词背后? 既怕遗漏重要进展, 又担心写的综述没有新意? 科研流程繁琐, 总在重复劳动中消耗灵感?
2025年11月13日,创新医疗技术公司 Beacon Biosignals 宣布完成 8600 万美元(约合人民币6.1亿) B 轮融资,由 GV(Google Ventures)、Takeda、Catalio 等跨科技与生命科学领域的重磅机构联合投资,使公司累计融资突破 1.21 亿美元。
在基础模型领域,模型规模与性能之间的缩放定律(Scaling Law)已被广泛验证,但模型增大也伴随着训练成本、存储需求和能耗的急剧上升。如何在控制参数量的前提下高效扩展模型,成为当前研究的关键挑战。
Claude 近期发布的 Skills 功能很火,不少开发者都在尝试、试用。