AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
模型A:幸亏有你,我才不得0分,模型B:俺也一样

模型A:幸亏有你,我才不得0分,模型B:俺也一样

模型A:幸亏有你,我才不得0分,模型B:俺也一样

琳琅满目的乐高积木,通过一块又一块的叠加,可以创造出各种栩栩如生的人物、景观等,不同的乐高作品相互组合,又能为爱好者带来新的创意。

来自主题: AI技术研报
9047 点击    2024-01-06 16:37
大模型套壳祛魅

大模型套壳祛魅

大模型套壳祛魅

本文探讨了大模型套壳的问题,解释了大模型的内核和预训练过程。同时,介绍了“原创派”和“模仿派”两种预训练框架的差异,并讨论了通过“偷”聊天模型数据进行微调的现象。最后,提出了把“壳”做厚才是竞争力的观点。

来自主题: AI资讯
7829 点击    2024-01-04 09:53
AI计算,为什么要用GPU?

AI计算,为什么要用GPU?

AI计算,为什么要用GPU?

本文介绍了为什么在AI计算中要使用GPU,以及GPU与CPU的区别和作用。GPU具备强悍的并行计算能力,适合处理大量高强度并行计算任务,包括深度学习算法。

来自主题: AI资讯
4947 点击    2024-01-02 21:29
符尧:别卷大模型训练了,来卷数据吧!【干货十足】

符尧:别卷大模型训练了,来卷数据吧!【干货十足】

符尧:别卷大模型训练了,来卷数据吧!【干货十足】

今天分享一篇符尧大佬的一篇数据工程(Data Engineering)的文章,解释了speed of grokking指标是什么,分析了数据工程

来自主题: AI资讯
9824 点击    2024-01-02 11:13
ChatGPT变笨新解释:世界被AI改变,与训练时不同了

ChatGPT变笨新解释:世界被AI改变,与训练时不同了

ChatGPT变笨新解释:世界被AI改变,与训练时不同了

对于ChatGPT变笨原因,学术界又有了一种新解释。加州大学圣克鲁兹分校一项研究指出:在训练数据截止之前的任务上,大模型表现明显更好。

来自主题: AI技术研报
4704 点击    2024-01-01 23:12
无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

一个来自MIT博士生的惊人发现:只需对Transformer的特定层进行一种非常简单的修剪,即可在缩小模型规模的同时显著提高模型性能。

来自主题: AI技术研报
2038 点击    2023-12-31 12:01
国产千卡千亿模型训练平台落地:70B到130B大模型训练,线性加速比达91%

国产千卡千亿模型训练平台落地:70B到130B大模型训练,线性加速比达91%

国产千卡千亿模型训练平台落地:70B到130B大模型训练,线性加速比达91%

国内首个以国产全功能GPU为底座的大规模算力集群,正式落地了!这便是来自摩尔线程的KUAE智算中心,全国产千卡千亿模型训练平台。

来自主题: AI资讯
11482 点击    2023-12-21 11:03