
全新MoE架构!阿里开源Qwen3-Next,训练成本直降9成
全新MoE架构!阿里开源Qwen3-Next,训练成本直降9成训练、推理性价比创新高。 大语言模型(LLM),正在进入 Next Level。 周五凌晨,阿里通义团队正式发布、开源了下一代基础模型架构 Qwen3-Next。总参数 80B 的模型仅激活 3B ,性能就可媲美千问 3 旗舰版 235B 模型,也超越了 Gemini-2.5-Flash-Thinking,实现了模型计算效率的重大突破。
训练、推理性价比创新高。 大语言模型(LLM),正在进入 Next Level。 周五凌晨,阿里通义团队正式发布、开源了下一代基础模型架构 Qwen3-Next。总参数 80B 的模型仅激活 3B ,性能就可媲美千问 3 旗舰版 235B 模型,也超越了 Gemini-2.5-Flash-Thinking,实现了模型计算效率的重大突破。
单台 8 卡 A800 仅需 8 秒即可生成 5 秒视频。
真是谁也没想到……
刚刚,0产出估值就已冲破120亿美元的Thinking Machines,终于发布首篇研究博客。
作为一名有着8年全栈开发经验的技术人员,我最近接手了一个具有挑战性的项目:为某中型服装电商平台开发一套智能商品推荐系统。该系统需要在2个月内完成,包含以下核心功能:
9 月 10 日,2025 Inclusion・外滩大会科技智能创新赛(简称 “外滩大会 AI 科创赛”)在上海圆满落幕。在上海市科学技术委员会指导下,大赛三大核心赛事 ——“人工智能硬件科创赛”、“AFAC 金融智能创新大赛” 和 “2025 全球 AI 攻防挑战赛” 的冠亚季军全部诞生。大赛设立多项创新奖项,共计 80 个项目获奖,涌现出一批兼具技术前瞻性与市场潜力的创新成果。
一群机械臂手忙脚乱地自己干活,彼此配合、互不碰撞。
2025 年上半年,日本 AI 应用市场呈现出一个鲜明特征,用户规模不大,但付费能力极强。日本总务省 7 月发布的《信息通信白皮书》显示,日本个人用户的生成式 AI 采用率仅为 26.7%,只有中国(81.2%)的三分之一,也远低于美国(68.8%)和德国(59.2%)。
一般人准确率89.1%,AI最好只有13.3%。在新视觉基准ClockBench上,读模拟时钟这道「小学题」,把11个大模型难住了。为什么AI还是读不准表?是测试有问题还是AI真不行?
苹果在 Hugging Face上放大招了!这次直接甩出两条多模态主线:FastVLM主打「快」,字幕能做到秒回;MobileCLIP2主打「轻」,在 iPhone 上也能起飞。更妙的是,模型和Demo已经全开放,Safari网页就能体验。大模型,真·跑上手机了。