华人横扫ICLR 2025杰出论文奖,三篇均为华人一作,中科大何向南团队/清华姚班北大校友在列
华人横扫ICLR 2025杰出论文奖,三篇均为华人一作,中科大何向南团队/清华姚班北大校友在列ICLR 2025杰出论文揭晓!
ICLR 2025杰出论文揭晓!
仅调整5%的骨干网络参数,就能超越全参数微调效果?!
无需数据标注,在测试时做强化学习,模型数学能力暴增159%!
写论文是许多学生面临的共同难题,尤其是在文献的收集与高效利用上。
为什么不能这样
刚刚,清华大模型团队 LeapLab 发布了一款面向 Agent 协作的开源框架:Cooragent。
Adam优化器是深度学习中常用的优化算法,但其性能背后的理论解释一直不完善。近日,来自清华大学的团队提出了RAD优化器,扩展了Adam的理论基础,提升了训练稳定性。实验显示RAD在多种强化学习任务中表现优于Adam。
新国产AI视频生成模型横空出世,一夜间全网刷屏。Magi-1,首个实现顶级画质输出的自回归视频生成模型,模型权重、代码100%开源。整整61页的技术报告中还详细介绍了创新的注意力改进和推理基础设施设计,给人一种视频版DeepSeek的感觉。
Hyper-RAG利用超图同时捕捉原始数据中的低阶和高阶关联信息,最大限度地减少知识结构化带来的信息丢失,从而减少大型语言模型(LLM)的幻觉。
北京时间4月16日,据彭博社报道,英伟达周二在监管文件中表示,美国政府已于周一通知公司,H20芯片未来在出口至中国时需要“无限期”申请许可证。