北大DeepSeek论文或预定ACL Best Paper!梁文锋署名
北大DeepSeek论文或预定ACL Best Paper!梁文锋署名北大DeepSeek联合发布的NSA论文,目前已被ACL 2025录用并获得了极高评分,甚至有望冲击最佳论文奖。该技术颠覆传统注意力机制,实现算力效率飞跃,被誉为长文本处理的革命性突破。
搜索
北大DeepSeek联合发布的NSA论文,目前已被ACL 2025录用并获得了极高评分,甚至有望冲击最佳论文奖。该技术颠覆传统注意力机制,实现算力效率飞跃,被誉为长文本处理的革命性突破。
理想中的多模态大模型应该是什么样?十所顶尖高校联合发布General-Level评估框架和General-Bench基准数据集,用五级分类制明确了多模态通才模型的能力标准。当前多模态大语言模型在任务支持、模态覆盖等方面存在不足,且多数通用模型未能超越专家模型,真正的通用人工智能需要实现模态间的协同效应。
AI能写论文、画图、考高分,但连「看表读时间」「今天是星期几」都错得离谱?最新研究揭示了背后惊人的认知缺陷,提醒我们:AI很强大,但精确推理还离不开人类。
今年5月10日,诞生于1995年的《攻壳机动队》修复版在国内上映。影片讲述了在未来世界,某国为了对抗高科技犯罪成立了公安9科,由保留了部分人类大脑的全身机械化义体人——草薙素子带队,抓捕史上最强网络黑客——“傀儡师”。
深谙“整合”之道的字节,又做了件大事。
ManiSkill-ViTac 2025视触觉融合挑战赛揭榜!全球42支团队激烈交锋,中国团队包揽三金,刷新国际榜单。
当技术范式重构,强者也不得不重新起跑。
随着大模型的参数规模不断扩大,分布式训练已成为人工智能发展的中心技术路径。
「Scaling Law 即将撞墙。」这一论断的一大主要依据是高质量数据不够用了
“这不仅仅是尴尬,这太令人心碎了。”没想到,AI圈的“瓜田”能精彩到这个地步。