这个AI精准模拟人类行为大脑状态,上Nature了
这个AI精准模拟人类行为大脑状态,上Nature了首个能跨领域精准预测人类认知的基础模型诞生!
首个能跨领域精准预测人类认知的基础模型诞生!
一年前,你想让AI画出“一只穿着复古皮衣、站在东京街头、日落光线打在墨镜上的猫”,得试个五六次,画出来要么穿错衣服,要么猫的动作奇特,要么背景得靠开盲盒抽卡。今天,在一众主流图像模型上,这句提示词几乎能一次命中。
AI也能选择性失忆?Meta联合NYU发布新作,轻松操控缩放Transformer注意头,让大模型「忘掉狗会叫」。记忆可删、偏见可调、安全可破,掀开大模型「可编辑时代」,安全边界何去何从。
2025年,某头部AI情感陪伴应用的增长预算,砍了近90%。
现在人工智能领域面临的最大挑战是广义的具身智能,即使你并不特别关心大脑本身……
近年来,视觉 - 语言 - 动作(Vision-Language-Action, VLA)模型因其出色的多模态理解与泛化能力,已成为机器人领域的重要研究方向。尽管相关技术取得了显著进展,但在实际部署中,尤其是在高频率和精细操作等任务中,VLA 模型仍受到推理速度瓶颈的严重制约。
近年来,随着扩散模型(Diffusion Models)和扩散 Transformer(DiT)在视频生成领域的广泛应用,AI 合成视频的质量和连贯性有了飞跃式提升。像 OpenAI Sora、HunyuanVideo、Wan2.1 等大模型,已经能够生成结构清晰、细节丰富且高度连贯的长视频内容,为数字内容创作、虚拟世界和多媒体娱乐带来了巨大变革。
美国AI初创公司 Perplexity 的联合创始人兼首席执行官Aravind Srinivas今日在社交平台发文,首次公开评价中国大模型“月之暗面”Kimi K2。他表示,Kimi K2 在内部测试中表现良好,Perplexity 正在考虑在其基础上进行后训练。
当整个 AI 视觉生成领域都在 Transformer 架构上「卷生卷死」时,一项来自北大、北邮和华为的最新研究却反其道而行之,重新审视了深度学习中最基础、最经典的模块——3x3 卷积。
奥特曼宣布无限期推迟OpenAI开源模型发布。与此同时,竞争对手正高调上新,开源赛道硝烟四起。这次跳票不仅令开发者和科技爱好者失望,也让外界再次质疑OpenAI在「Open」与商业利益之间的身份撕裂与信任危机。