AI资讯新闻榜单内容搜索-训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 训练

芝大论文证明GPT-4选股准确率高达60%，人类股票分析师要下岗？AI大牛质疑数据污染

芝大论文证明GPT-4选股准确率高达60%，人类股票分析师要下岗？AI大牛质疑数据污染

芝大论文证明GPT-4选股准确率高达60%，人类股票分析师要下岗？AI大牛质疑数据污染

GPT-4在为人类选股时，表现竟然超越了大部分人类分析师，和针对金融训练的专业模型？在没有任何上下文的情况下，它们直接就成功分析了财务报表，这一发现让许多业内大咖震惊了。然而好景不长，有AI大牛指出研究中的bug：之所以会这样，很可能是训练数据被污染了。

来自主题: AI资讯

8616 点击 2024-05-27 15:32

ICML 2024 | 脱离LoRA架构，训练参数大幅减少，新型傅立叶微调来了

ICML 2024 | 脱离LoRA架构，训练参数大幅减少，新型傅立叶微调来了

ICML 2024 | 脱离LoRA架构，训练参数大幅减少，新型傅立叶微调来了

本文介绍了香港科技大学（广州）的一篇关于大模型高效微调（LLM PEFT Fine-tuning）的文章「Parameter-Efficient Fine-Tuning with Discrete Fourier Transform」

来自主题: AI技术研报

11397 点击 2024-05-26 13:50

全面超越DPO：陈丹琦团队提出简单偏好优化SimPO，还炼出最强8B开源模型

全面超越DPO：陈丹琦团队提出简单偏好优化SimPO，还炼出最强8B开源模型

全面超越DPO：陈丹琦团队提出简单偏好优化SimPO，还炼出最强8B开源模型

为了将大型语言模型（LLM）与人类的价值和意图对齐，学习人类反馈至关重要，这能确保它们是有用的、诚实的和无害的。在对齐 LLM 方面，一种有效的方法是根据人类反馈的强化学习（RLHF）。尽管经典 RLHF 方法的结果很出色，但其多阶段的过程依然带来了一些优化难题，其中涉及到训练一个奖励模型，然后优化一个策略模型来最大化该奖励。

来自主题: AI技术研报

11511 点击 2024-05-26 13:45

估值飙至138亿美元！27岁华裔天才少年再获融资，数据标注会是下一个风口？

估值飙至138亿美元！27岁华裔天才少年再获融资，数据标注会是下一个风口？

估值飙至138亿美元！27岁华裔天才少年再获融资，数据标注会是下一个风口？

Alexandr Wang创办的Scale AI是一个为AI模型提供训练数据的数据标注平台，近期完成新一轮10亿美元融资，估值飙升至138亿美元。该公司表示将利用新资金生产丰富的前沿数据，为通向AGI铺平道路。

来自主题: AI资讯

11406 点击 2024-05-26 12:05

大模型“国家队”发力了，中国移动发布“万百千”

大模型“国家队”发力了，中国移动发布“万百千”

大模型“国家队”发力了，中国移动发布“万百千”

国产大模型最新进展，这次来自“国家队”！刚刚，全栈国产化生态大模型“九天智能基座”正式发布！它由中国移动自研。包括万卡算力、千亿模型及百汇平台三部分。其中模型部分是九天自主研发的从算子到框架全栈国产训练的千亿参数大模型，能力达到GPT-4的90%水平。

来自主题: AI资讯

11069 点击 2024-05-25 18:32

用基础模型指导特征传播，首个泛化型图像匹配器OmniGlue搞定未见过域

用基础模型指导特征传播，首个泛化型图像匹配器OmniGlue搞定未见过域

用基础模型指导特征传播，首个泛化型图像匹配器OmniGlue搞定未见过域

第一个以「泛化」能力为核心设计原则的可学习图像匹配器来了！

来自主题: AI技术研报

10825 点击 2024-05-25 18:21

只需单卡RTX 3090，低比特量化训练就能实现LLaMA-3 8B全参微调

只需单卡RTX 3090，低比特量化训练就能实现LLaMA-3 8B全参微调

只需单卡RTX 3090，低比特量化训练就能实现LLaMA-3 8B全参微调

本文由GreenBit.AI团队撰写，团队的核心成员来自德国哈索·普拉特纳计算机系统工程院开源技术小组。我们致力于推动开源社区的发展，倡导可持续的机器学习理念。我们的目标是通过提供更具成本效益的解决方案，使人工智能技术在环境和社会层面产生积极影响。

来自主题: AI技术研报

9735 点击 2024-05-25 18:15

Bengio等人新作：注意力可被视为RNN，新模型媲美Transformer，但超级省内存

Bengio等人新作：注意力可被视为RNN，新模型媲美Transformer，但超级省内存

Bengio等人新作：注意力可被视为RNN，新模型媲美Transformer，但超级省内存

既能像 Transformer 一样并行训练，推理时内存需求又不随 token 数线性递增，长上下文又有新思路了？

来自主题: AI技术研报

8463 点击 2024-05-25 18:07

腾讯PCG自研高性能大语言模型推理引擎「一念LLM」正式开源

腾讯PCG自研高性能大语言模型推理引擎「一念LLM」正式开源

腾讯PCG自研高性能大语言模型推理引擎「一念LLM」正式开源

以 OpenAI 的 GPT 系列模型为代表的大语言模型（LLM）掀起了新一轮 AI 应用浪潮，但是 LLM 推理的高昂成本一直困扰着业务团队。

来自主题: AI技术研报

11038 点击 2024-05-24 20:58

从80个模型中构建Scaling Law：华人博士生新作，思维链提出者力荐

从80个模型中构建Scaling Law：华人博士生新作，思维链提出者力荐

从80个模型中构建Scaling Law：华人博士生新作，思维链提出者力荐

在 AI 领域，扩展定律（Scaling laws）是理解 LM 扩展趋势的强大工具，其为广大研究者提供了一个准则，该定律在理解语言模型的性能如何随规模变化提供了一个重要指导。

来自主题: AI技术研报

5597 点击 2024-05-24 20:52

上一页当前第403页,共448页下一页