AI资讯新闻榜单内容搜索-训练

GPT-4o mini实力霸榜，限时2个月微调不花钱！每天200万训练token免费薅

Llama 3.1 405B巨兽开源的同时，OpenAI又抢了一波风头。从现在起，每天200万训练token免费微调模型，截止到9月23日。

来自主题: AI资讯

5547 点击 2024-07-26 17:20

RNN每个step的隐状态都取决于上一个step的输出，这种连续的状态转移方式使得RNN天然带有位置信息。

来自主题: AI技术研报

7697 点击 2024-07-26 09:23

Transformer中的信息流动机制，被最新研究揭开了：

来自主题: AI技术研报

10827 点击 2024-07-25 22:24

9次迭代后，模型开始出现诡异乱码，直接原地崩溃！就在今天，牛津、剑桥等机构的一篇论文登上了Nature封面，称合成数据就像近亲繁殖，效果无异于投毒。有无破解之法？那就是——更多使用人类数据！

来自主题: AI技术研报

9067 点击 2024-07-25 21:24

本文介绍清华大学的一篇关于长尾视觉识别的论文: Probabilistic Contrastive Learning for Long-Tailed Visual Recognition. 该工作已被 TPAMI 2024 录用，代码已开源。

来自主题: AI技术研报

7850 点击 2024-07-25 18:28

OpenAI 的新奖励机制，让大模型更听话了。

来自主题: AI技术研报

6499 点击 2024-07-25 18:25

就在去年，由斯坦福大学和谷歌的研究团队开发的“AI小镇”一举引爆了人工智能社区，成为各大媒体争相报道的热点。他们让多个基于大语言模型（LLMs）的智能体扮演不同的身份和角色在虚拟小镇上工作和生活，将《西部世界》中的科幻场景照进了现实中。

来自主题: AI技术研报

4861 点击 2024-07-25 18:22

训练数据是用 GPT-4o 生成的？那质量不好说了。

来自主题: AI资讯

10184 点击 2024-07-25 18:13

为何会发生？可以避免吗？

来自主题: AI资讯

11218 点击 2024-07-25 11:23

榨干16000块H100、基于15亿个Tokens训练。

来自主题: AI资讯

6172 点击 2024-07-25 10:32