FlashAttention-4正式发布:算法流水线大改,矩阵乘法级速度
FlashAttention-4正式发布:算法流水线大改,矩阵乘法级速度近日,深度学习领域重要底层优化技术 FlashAttention 迎来大版本更新。FlashAttention 核心作者、普林斯顿大学助理教授 Tri Dao 表示,在 Blackwell GPU 上,即使瓶颈截然不同,注意力机制的执行速度现在也几乎与矩阵乘法一样快了!
近日,深度学习领域重要底层优化技术 FlashAttention 迎来大版本更新。FlashAttention 核心作者、普林斯顿大学助理教授 Tri Dao 表示,在 Blackwell GPU 上,即使瓶颈截然不同,注意力机制的执行速度现在也几乎与矩阵乘法一样快了!
美方正酝酿全球 AI 算力分级审查制:海外采购 1000 枚以下先进芯片面临严苛豁免条件,中大型集群须获预批;超 20 万枚项目更需国家级交涉,并被迫向美方开放核心机密与实地审查。此举正引发全球对经济主权与商业安全的深度担忧。
今年年初,Grok核心架构师杨格因病退出xAI日常工作。他透露,在xAI创立期间的“长期高强度工作”和“把自己逼得太狠”导致免疫系统受损,最终使病情显现和恶化。
近期,大连理工与快手可灵团队推出了 MultiShotMaster—— 一个高度可控的多镜头视频生成框架,该论文向研究社区展示了即使在 1B 左右的小参数量级模型上,也可以实现导演级的镜头调度和连贯叙事,且支持多图参考、主体运动控制。
通用人工智能公司 VAST 今日宣布完成 5000 万美元 A 轮融资。本轮融资由阿里、恒旭资本联合领投,元禾璞华、BV 百度风投、东方嘉富等跟投,形成覆盖顶级资本、产业巨头、知名战投的全方位赋能格局。
你是不是也在思考这个问题: AI大模型之间的真实差距,真的像各种榜单上表现得那样直观吗?
刚刚,YuanLab.ai团队正式开源发布源Yuan3.0 Ultra多模态基础大模型。
昨天,计算机科学的活传奇、88 岁的图灵奖得主 Don Knuth,在自己的论文里正式感谢了一个 AI。
离职的消息最沸沸扬扬的时候,Qwen 团队的核心负责人林俊旸在朋友圈发了两句话:
近年来,视觉大模型在自动驾驶、智慧医疗等场景中得到广泛应用,但在真实业务环境中,“大而全”的通用模型往往并不是最优选择。