FlashAttention-4震撼来袭,原生支持Blackwell GPU,英伟达的护城河更深了?
FlashAttention-4震撼来袭,原生支持Blackwell GPU,英伟达的护城河更深了?在正在举办的半导体行业会议 Hot Chips 2025 上,TogetherAI 首席科学家 Tri Dao 公布了 FlashAttention-4。
搜索
在正在举办的半导体行业会议 Hot Chips 2025 上,TogetherAI 首席科学家 Tri Dao 公布了 FlashAttention-4。
2023年,AI浪潮席卷全球,无数创业者开始了一场寻找“下一代硬件”的竞赛。
当大多数 AI 教育公司还在为盈利发愁时,成立仅两年的 Praktika,交出的一组运营数据:30人团队支撑起近 2000 万美元年化收入,超500万用户,在2024 年 5 月拿下 Blossom Capital 领投的 3550 万美元 A 轮融资,加上早期种子轮,总融资已达 3800 万美元,这个靠 AI 虚拟外教(Avatar)走红的 App,正在重新定义语言学习的商业模式。
Humain 作为沙特领先的人工智能公司,已推出一款面向阿拉伯和穆斯林群体的对话式 AI 应用,正值沙特寻求在该技术领域获得区域领导地位之际。
在AI客服这个看似红海的赛道里,几乎每个人都遇到过这样的尴尬:明明刚刚告诉AI你的会员账号,转个身的功夫它就不记得了。这种被称为“金鱼脑”的AI失忆现象,正是大模型在企业级应用中最大的痛点。
Transformer 架构对计算和内存的巨大需求使得大模型效率的提升成为一大难题。为应对这一挑战,研究者们投入了大量精力来设计更高效的 LM 架构。
你有没有想过,一家小企业想要贷款时,为什么总是被迫在两个极端选择之间挣扎?要么选择社区银行的低利率,但要忍受漫长的审批流程和落后的数字化体验;要么转向在线放贷平台的快速审批,却要承受高达60%的年化利率。这种看似无解的困境,正在被一家名为Casca的创业公司彻底颠覆。
头部科技公司已经开始卡位新AI时代软硬件一体能力,一个判断是,只能做硬件或只能做软件的公司或许都会损失一部分竞争力
如今,Facebook与Instagram已正式上线Reels短视频的音频翻译功能。该功能依托AI技术,可直接将视频中的人物音频翻译成不同语种,不仅支持双人对话翻译,还能实现嘴型对齐,并根据对话双方的原始音色,合成声线高度相似的翻译音轨。
国务院发布《“人工智能+”行动意见》,是国家层面对AI战略的全面升级。政策提出“智能原生”新概念,设定2027/2030/2035年关键节点,强调技术普惠化与产业深度融合。重点布局科技、产业、消费、民生、治理、全球合作六大领域,并为普通人提供低门槛参与路径。