AI资讯新闻榜单内容搜索-模型训练

北大李戈团队提出大模型单测生成新方法，显著提升代码测试覆盖率

单元测试是软件开发流程中的一个关键环节，主要用于验证软件中的最小可测试单元，函数或模块是否按预期工作。单元测试的目标是确保每个独立的代码片段都能正确执行其功能，对于提高软件质量和开发效率具有重要意义。

来自主题: AI技术研报

6705 点击 2024-09-03 16:22

KV Cache 是大模型推理性能优化的一个常用技术，该技术可以在不影响任何计算精度的前提下，通过空间换时间的思想，提高推理性能。

来自主题: AI资讯

9017 点击 2024-09-03 10:46

AnyGraph聚焦于解决图数据的核心难题，跨越多种场景、特征和数据集进行预训练。其采用混合专家模型和特征统一方法处理结构和特征异质性，通过轻量化路由机制和高效设计提升快速适应能力，且在泛化能力上符合Scaling Law。

来自主题: AI技术研报

9855 点击 2024-09-02 16:35

该论文作者均来自于华南理工大学马千里教授团队，所在实验室为机器学习与数据挖掘实验室。论文的三位共同第一作者为博士生郑俊豪、硕士生邱圣洁、硕士生施成明，主要研究方向包括大模型和终生学习等，通讯作者为马千里教授（IEEE/ACM TASLP 副主编）。

来自主题: AI资讯

7038 点击 2024-09-01 15:57

本文第一作者为香港大学博士研究生谢知晖，主要研究兴趣为大模型对齐与强化学习。

来自主题: AI技术研报

7734 点击 2024-08-31 15:09

Transformer 在深度学习领域取得巨大成功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分，实现了更好的上下文理解。然而，注意力机制的缺点是计算开销大，会随输入规模而二次增长，Transformer 也因此难以处理非常长的文本。

来自主题: AI技术研报

9450 点击 2024-08-31 14:54

罗盟，本工作的第一作者。新加坡国立大学（NUS）人工智能专业准博士生，本科毕业于武汉大学。主要研究方向为多模态大语言模型和 Social AI、Human-eccentric AI。

来自主题: AI技术研报

7062 点击 2024-08-31 10:14

让AI像人类一样借助多模态线索定位感兴趣的物体，有新招了！

来自主题: AI技术研报

8290 点击 2024-08-30 15:30

本文的主要作者来自香港大学的数据智能实验室 (Data Intelligence Lab@HKU)。

来自主题: AI技术研报

8885 点击 2024-08-29 17:05

人工神经网络、深度学习方法和反向传播算法构成了现代机器学习和人工智能的基础。但现有方法往往是一个阶段更新网络权重，另一个阶段在使用或评估网络时权重保持不变。这与许多需要持续学习的应用程序形成鲜明对比。

来自主题: AI技术研报

9282 点击 2024-08-29 17:01