AI资讯新闻榜单内容搜索-模型

低内存占用也能实现满血训练？！北理北大港中文MMLab推出Fira训练框架

内存占用小，训练表现也要好……大模型训练成功实现二者兼得。来自北理、北大和港中文MMLab的研究团队提出了一种满足低秩约束的大模型全秩训练框架——Fira，成功打破了传统低秩方法中内存占用与训练表现的“非此即彼”僵局。

来自主题: AI技术研报

5195 点击 2024-10-21 10:58

简单高效的大模型检索增强系统LightRAG，香港大学黄超团队最新研究成果。开源两周时间在GitHub上获得将近5k标星，并登上趋势榜。

来自主题: AI技术研报

6035 点击 2024-10-21 10:23

能拿下数学奥赛银牌水平的AI是否达到了12岁陶哲轩的水平？陶神本人的回答来了

来自主题: AI技术研报

4589 点击 2024-10-21 09:53

Indeed Hiring Lab 评估了OpenAI开发的生成式AI模型GPT-4在超过2800项工作技能中的表现。

来自主题: AI技术研报

5106 点击 2024-10-21 09:45

来自主题: AI技术研报

6338 点击 2024-10-20 17:34

2022年诞生的ChatGPT，已经在相当程度上实现了大模型的Scaling law（尺度定律）和通用能力涌现。

来自主题: AI资讯

4712 点击 2024-10-20 17:28

近日，来自谷歌和苹果的研究表明：AI模型掌握的知识比表现出来的要多得多！这些真实性信息集中在特定的token中，利用这一属性可以显著提高检测LLM错误输出的能力。

来自主题: AI技术研报

4395 点击 2024-10-20 17:16

LLM训练速度还可以再飙升20倍！英伟达团队祭出全新架构归一化Transformer（nGPT），上下文越长，训练速度越快，还能维持原有精度。

来自主题: AI技术研报

5527 点击 2024-10-20 17:11

大型语言模型（LLMs）虽然在适应新任务方面取得了长足进步，但它们仍面临着巨大的计算资源消耗，尤其在复杂领域的表现往往不尽如人意。

来自主题: AI技术研报

5764 点击 2024-10-20 16:58

现在正是「文本生视频」赛道百花齐放的时代，而且其应用场景非常多，比如生成创意视频内容、创建游戏场景、制作动画和电影。

来自主题: AI技术研报

4875 点击 2024-10-20 16:55