AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
AI计算,为什么要用GPU?

AI计算,为什么要用GPU?

AI计算,为什么要用GPU?

本文介绍了为什么在AI计算中要使用GPU,以及GPU与CPU的区别和作用。GPU具备强悍的并行计算能力,适合处理大量高强度并行计算任务,包括深度学习算法。

来自主题: AI资讯
4968 点击    2024-01-02 21:29
符尧:别卷大模型训练了,来卷数据吧!【干货十足】

符尧:别卷大模型训练了,来卷数据吧!【干货十足】

符尧:别卷大模型训练了,来卷数据吧!【干货十足】

今天分享一篇符尧大佬的一篇数据工程(Data Engineering)的文章,解释了speed of grokking指标是什么,分析了数据工程

来自主题: AI资讯
9856 点击    2024-01-02 11:13
ChatGPT变笨新解释:世界被AI改变,与训练时不同了

ChatGPT变笨新解释:世界被AI改变,与训练时不同了

ChatGPT变笨新解释:世界被AI改变,与训练时不同了

对于ChatGPT变笨原因,学术界又有了一种新解释。加州大学圣克鲁兹分校一项研究指出:在训练数据截止之前的任务上,大模型表现明显更好。

来自主题: AI技术研报
4722 点击    2024-01-01 23:12
无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

一个来自MIT博士生的惊人发现:只需对Transformer的特定层进行一种非常简单的修剪,即可在缩小模型规模的同时显著提高模型性能。

来自主题: AI技术研报
2056 点击    2023-12-31 12:01
从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

大规模语言模型(LLMs)在很多关键任务中展现出显著的能力,比如自然语言理解、语言生成和复杂推理,并对社会产生深远的影响。然而,这些卓越的能力伴随着对庞大训练资源的需求(如下图左)和较长推理时延(如下图右)。因此,研究者们需要开发出有效的技术手段去解决其效率问题。

来自主题: AI技术研报
4815 点击    2023-12-30 15:16
2024生成式AI十大展望

2024生成式AI十大展望

2024生成式AI十大展望

2024年,优化训练和部署大模型仍然非常重要,大模型的生态加速形成,应用开始在一些领域大规模展开,主要表现在如下十个领域:

来自主题: AI资讯
4593 点击    2023-12-30 10:24
ChatGPT面临销毁?GPT-4被曝逐字照抄原文,OpenAI或将赔偿数十亿美元

ChatGPT面临销毁?GPT-4被曝逐字照抄原文,OpenAI或将赔偿数十亿美元

ChatGPT面临销毁?GPT-4被曝逐字照抄原文,OpenAI或将赔偿数十亿美元

今天,纽约时报对OpenAI和微软正式提起诉讼,指控其未经授权就使用纽约时报内容训练人工智能模型。此案可能是人工智能使用知识版权纠纷的分水岭。

来自主题: AI资讯
8968 点击    2023-12-29 09:59