AI资讯新闻榜单内容搜索-训练

当LLM遇到结构化思维困境，这个70年前的心理学框架竟成为救星 | 最新

当大多数AI Agent仍在挣扎于结构化推理能力不足的困境时，本文带来了一个来自认知科学领域的突破性解决方案。

来自主题: AI技术研报

8321 点击 2025-04-04 15:50

移动通信领域有了新SOTA：华为出品，精准预测用户行为

专门解决电信行业用户行为建模的难题。

来自主题: AI技术研报

6535 点击 2025-04-04 14:42

浙大校友重磅革新Transformer！多token注意力让LLM开挂，错误率归0

简单的任务，传统的Transformer却错误率极高。Meta FAIR团队重磅推出多token注意力机制（MTA），精准捕捉复杂信息，带来模型性能飞升！

来自主题: AI技术研报

7300 点击 2025-04-04 14:14

ICLR 2025 Spotlight | 参数高效微调新范式！上海交大联合上海AI Lab推出参数冗余微调算法

低秩适配器（LoRA）能够在有监督微调中以约 5% 的可训练参数实现全参数微调 90% 性能。

来自主题: AI技术研报

9335 点击 2025-04-04 14:03

近千个反现实视频构建了「不可能」基准，哪个AI不服？来战！

随着人工智能合成视频（AIGC）技术的飞速发展，我们正步入一个由 AI 主导的视频创作时代。

来自主题: AI技术研报

8201 点击 2025-04-03 16:33

AMD GPU性能暴涨7倍，优化算法首次开源！高效MoE支持任意专家数量

通过完全启用并发多块执行，支持任意专家数量（MAX_EXPERT_NUMBER==256），并积极利用共享内存（5kB LDS）和寄存器（52 VGPRs，48 SGPRs），MoE Align & Sort逻辑被精心设计，实现了显著的性能提升：A100提升3倍，H200提升3倍，MI100提升10倍，MI300X/MI300A提升7倍...

来自主题: AI技术研报

4870 点击 2025-04-03 16:14