
手机流畅处理128K长文本,vivo端侧新算法突破内存限制 | ACL 2025
手机流畅处理128K长文本,vivo端侧新算法突破内存限制 | ACL 2025在端侧设备上处理长文本常常面临计算和内存瓶颈。
在端侧设备上处理长文本常常面临计算和内存瓶颈。
北大DeepSeek联合发布的NSA论文,目前已被ACL 2025录用并获得了极高评分,甚至有望冲击最佳论文奖。该技术颠覆传统注意力机制,实现算力效率飞跃,被誉为长文本处理的革命性突破。
ACL 2025录用结果新鲜出炉,8000多篇总投稿量破纪录。今年竞争异常激烈,高分被拒者一大片,还有创新论文因评审标准脱节受挫。
4月17日据《金融时报》周四报道,OpenAI和Oracle(ORCL.N)为其重要项目“星际之门”权衡英国未来投资,因为它正在探索海外地点以建立人工智能基础设施。
大模型在文本生成方面取得了卓越的成就,通过合适的prompt设计,往往可以使得生成结果符合特定的需求。但是为属性繁多的任务设计出合适的prompt是很困难的。一种解决方案是通过线性组合方式或者其变种将每个属性对应的模型在生成logits上进行融合。鉴于属性之间可能存在的冲突现象,这种方案无法保证模型的主属性不受其他模型的干扰。
谷歌团队发布LLM硬核技术教科书,从「系统视图」揭秘LLM Scaling的神秘面纱。Jeff Dean强调书中藏着谷歌最强AI模型Gemini训练的更多信息。
2024年底,一则《雷军千万年薪挖角95后AI天才少女》的热搜引爆全网,让“罗福莉”这个名字再度成为热门话题。事实上,早在2019年,“八篇ACL论文”的佳绩就让她在硕士期间成为知乎上的风云人物。直通阿里星项目进入达摩院、开源大模型DeepSeek-V2的核心开发者、“天才AI美少女萝莉”……这些闪亮的头衔让人不禁好奇,这位95后女孩究竟有何特别之处?
在 24 年 4 月,我们第一次得知了 Flowith 这个产品,随后便被它创新的交互模式与独特的 AI 生成工作流的 Oracle Agent 所吸引。创始人 Derek 在社交媒体上的帖子也非常振奋人心。与特工们气味相投,有种理想主义的极客风格。
近日,Crusoe Energy 宣布已筹集 6.86 亿美元,使其最新融资目标达到 8.18 亿美元。这笔资金将主要用于在德克萨斯州建设一个大型 AI 数据中心,并计划将该中心租赁给 Oracle(甲骨文)、微软 和 OpenAI 等知名公司,以支持其不断增长的算力需求。
现在,用LLM一键就能生成百万级领域知识图谱了?! 来自中科大MIRA实验室研究人员提出一种通用的自动化知识图谱构建新框架SAC-KG