
统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与
统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与如今,多模态大模型(MLLM)已经在视觉理解领域取得了长足进步,其中视觉指令调整方法已被广泛应用。该方法是具有数据和计算效率方面的优势,其有效性表明大语言模型(LLM)拥有了大量固有的视觉知识,使得它们能够在指令调整过程中有效地学习和发展视觉理解。
如今,多模态大模型(MLLM)已经在视觉理解领域取得了长足进步,其中视觉指令调整方法已被广泛应用。该方法是具有数据和计算效率方面的优势,其有效性表明大语言模型(LLM)拥有了大量固有的视觉知识,使得它们能够在指令调整过程中有效地学习和发展视觉理解。
12月19日,路透社援引三名消息人士的说法称,苹果公司正与腾讯和字节跳动商谈将二者的人工智能模型整合到在国行iPhone中。不过,据悉这些涉及人工智能大模型的讨论还处于非常早期的阶段。
今年 9 月 iPhone 16 系列发布时,库克明确表示:“新一代 iPhone 彻彻底底为 Apple Intelligence 打造,一个让人激动的新纪元由此开始。”
今年苹果最热的产品或许就是“Apple智能”功能,但作为核心设备的iPhone,支持型号屈指可数:仅有iPhone 15 Pro和iPhone 16系列,就连去年才发布的iPhone 15都因为苹果宣称的“配置问题”无缘AI。
OpenAI谷歌天天刷流量,微软也坐不住了,推出最新小模型Phi-4。 参数量仅14B,MMLU性能就和Llama 3.3/ Qwen2.5等70B级别大模型坐一桌。
苹果首款 AI 芯片「Baltra」2026 年量产。
融合物理知识的大型视频语言模型PhysVLM,开源了! 它不仅在 PhysGame 基准上展现出最先进的性能,还在通用视频理解基准上(Video-MME, VCG)表现出领先的性能。
苹果今日向iPhone用户推送了 iOS 18.2 RC 更新(内部版本号:22C150),本次更新距离上次发布 Beta/RC 间隔15天。
今天,LiblibAI与千万用户一起揭幕我们的自研图像大模型。 Star-3 Alpha 图像基座模型来了。Star-3 Alpha大模型,基于业界领先的F.1基础算法架构训练而成。 相较于以往的所有模型,Star-3 Alpha在生图效果上实现了显著的飞跃,在图像精准度、色彩表现力、美学捕捉的细腻表达等方面成为新的业界标杆。
如果说有一类游戏贯穿AI发展的始终,围绕其诞生的Thinking Game至今仍影响着最前沿AI技术的发展,那么答案很显然: 棋类游戏。