AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

综述170篇「自监督学习」推荐算法，港大发布SSL4Rec：代码、资料库全面开源！

综述170篇「自监督学习」推荐算法，港大发布SSL4Rec：代码、资料库全面开源！

综述170篇「自监督学习」推荐算法，港大发布SSL4Rec：代码、资料库全面开源！

推荐系统对于应对信息过载挑战至关重要，它们根据用户的个人偏好提供定制化推荐。近年来深度学习技术极大地推动了推荐系统的发展，提升了对用户行为和偏好的洞察力。

来自主题: AI技术研报

10436 点击 2024-05-09 19:10

Unsloth x Qwen2，提速47.32%，节省39.13%显存，最少仅需8.43GB显存

Unsloth x Qwen2，提速47.32%，节省39.13%显存，最少仅需8.43GB显存

Unsloth x Qwen2，提速47.32%，节省39.13%显存，最少仅需8.43GB显存

在上一篇文章「Unsloth微调Llama3-8B，提速44.35%，节省42.58%显存，最少仅需7.75GB显存」中，我们介绍了Unsloth，这是一个大模型训练加速和显存高效的训练框架，我们已将其整合到Firefly训练框架中，并且对Llama3-8B的训练进行了测试，Unsloth可大幅提升训练速度和减少显存占用。

来自主题: AI技术研报

5534 点击 2024-05-08 12:21

低质多模态数据融合，多家机构联合出了篇综述论文

低质多模态数据融合，多家机构联合出了篇综述论文

低质多模态数据融合，多家机构联合出了篇综述论文

多模态融合是多模态智能中的基础任务之一。

来自主题: AI技术研报

9785 点击 2024-05-08 12:18

微调和量化竟会增加越狱风险！Mistral、Llama等无一幸免

微调和量化竟会增加越狱风险！Mistral、Llama等无一幸免

微调和量化竟会增加越狱风险！Mistral、Llama等无一幸免

大模型又又又被曝出安全问题！

来自主题: AI技术研报

10546 点击 2024-05-07 22:26

让机器准确「看懂」手物交互动作，清华大学等提出GeneOH Diffusion方法

让机器准确「看懂」手物交互动作，清华大学等提出GeneOH Diffusion方法

让机器准确「看懂」手物交互动作，清华大学等提出GeneOH Diffusion方法

在机器学习和计算机视觉中，让机器准确地识别和理解手和物体之间的交互动作，那是相当费劲。

来自主题: AI技术研报

10908 点击 2024-05-07 18:27

一个大模型训练成本要上亿美元，为何开发AI如此烧钱？

一个大模型训练成本要上亿美元，为何开发AI如此烧钱？

一个大模型训练成本要上亿美元，为何开发AI如此烧钱？

AI发展驱动收入增长，但成本激增需大投资。

来自主题: AI资讯

5444 点击 2024-05-07 11:19

硬核解决Sora的物理bug！美国四所顶尖高校联合发布：给视频生成器装个物理引擎

硬核解决Sora的物理bug！美国四所顶尖高校联合发布：给视频生成器装个物理引擎

硬核解决Sora的物理bug！美国四所顶尖高校联合发布：给视频生成器装个物理引擎

Sora刚发布后没多久，火眼金睛的网友们就发现了不少bug，比如模型对物理世界知之甚少，小狗在走路的时候，两条前腿就出现了交错问题，让人非常出戏。对于生成视频的真实感来说，物体的交互非常重要，但目前来说，合成真实3D物体在交互中的动态行为仍然非常困难。

来自主题: AI技术研报

10157 点击 2024-05-06 21:28

看透物体的3D表示和生成模型：NUS团队提出X-Ray

看透物体的3D表示和生成模型：NUS团队提出X-Ray

看透物体的3D表示和生成模型：NUS团队提出X-Ray

如今的生成式AI在人工智能领域迅猛发展，在计算机视觉中，图像和视频生成技术已日渐成熟，如Midjourney、Stable Video Diffusion [1]等模型广泛应用。然而，三维视觉领域的生成模型仍面临挑战。

来自主题: AI技术研报

5355 点击 2024-05-06 17:52

为了给大模型找语料，有人开始进行“互联网考古”

为了给大模型找语料，有人开始进行“互联网考古”

为了给大模型找语料，有人开始进行“互联网考古”

过去一年，AI大模型无疑是科技行业中最亮眼的主角，从FAAMG到BAT、再到一众初创企业，无数优秀的大脑、海量的资源都投入到了这个有望解放人类生产力的赛道中。

来自主题: AI资讯

11232 点击 2024-05-06 12:54

开源15T tokens！HuggingFace放出规模最大、质量最高预训练数据集

开源15T tokens！HuggingFace放出规模最大、质量最高预训练数据集

开源15T tokens！HuggingFace放出规模最大、质量最高预训练数据集

Meta最近开源的Llama 3模型再次证明了「数据」是提升性能的关键，但现状是，开源的大模型有一堆，可开源的大规模数据却没多少，而收集、清洗数据又是一项极其费时费力的工作，也导致了大模型预训练技术仍然掌握在少数高端机构的手中。

来自主题: AI技术研报

6593 点击 2024-05-05 19:51

上一页当前第355页,共379页下一页