AI资讯新闻榜单内容搜索-训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 训练

Token化一切，甚至网络！北大&谷歌&马普所提出TokenFormer，Transformer从来没有这么灵活过！

Token化一切，甚至网络！北大&谷歌&马普所提出TokenFormer，Transformer从来没有这么灵活过！

Token化一切，甚至网络！北大&谷歌&马普所提出TokenFormer，Transformer从来没有这么灵活过！

新一代通用灵活的网络结构 TokenFormer: Rethinking Transformer Scaling with Tokenized Model Parameters 来啦！

来自主题: AI技术研报

7843 点击 2024-11-14 14:13

1000多个智能体组成，AI社会模拟器MATRIX-Gen助力大模型自我进化

1000多个智能体组成，AI社会模拟器MATRIX-Gen助力大模型自我进化

1000多个智能体组成，AI社会模拟器MATRIX-Gen助力大模型自我进化

随着大语言模型（LLMs）在处理复杂任务中的广泛应用，高质量数据的获取变得尤为关键。为了确保模型能够准确理解并执行用户指令，模型必须依赖大量真实且多样化的数据进行后训练。然而，获取此类数据往往伴随着高昂的成本和数据稀缺性。因此，如何有效生成能够反映现实需求的高质量合成数据，成为了当前亟需解决的核心挑战。

来自主题: AI技术研报

8352 点击 2024-11-14 14:07

Nature：AI也许可以拥有常识，但不是现在

Nature：AI也许可以拥有常识，但不是现在

Nature：AI也许可以拥有常识，但不是现在

LLM未实现机器常识，挑战常识推理。

来自主题: AI资讯

3576 点击 2024-11-14 10:30

稚晖君后宇树也来玩开源了：机器人操作数据集，采用抱抱脸LeRobot训练测试，网友：泰裤辣！

稚晖君后宇树也来玩开源了：机器人操作数据集，采用抱抱脸LeRobot训练测试，网友：泰裤辣！

稚晖君后宇树也来玩开源了：机器人操作数据集，采用抱抱脸LeRobot训练测试，网友：泰裤辣！

继稚晖君之后，国内又一家头部机器人公司玩起了开源！

来自主题: AI资讯

11737 点击 2024-11-13 16:38

今日最热论文：Scaling Law后继乏力，量化也不管用，AI大佬齐刷刷附议

今日最热论文：Scaling Law后继乏力，量化也不管用，AI大佬齐刷刷附议

今日最热论文：Scaling Law后继乏力，量化也不管用，AI大佬齐刷刷附议

几十万人关注，一发表即被行业大佬评为“这是很长时间以来最重要的论文”。

来自主题: AI资讯

6892 点击 2024-11-13 16:31

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

从文字生成三维世界的场景有多难？

来自主题: AI技术研报

9352 点击 2024-11-13 16:21

WHALE来了，南大周志华团队做出更强泛化的世界模型

WHALE来了，南大周志华团队做出更强泛化的世界模型

WHALE来了，南大周志华团队做出更强泛化的世界模型

世界模型又出新进展了，来自国内机构。

来自主题: AI技术研报

6483 点击 2024-11-13 16:15

首个多模态连续学习综述，港中文、清华、UIC联合发布

首个多模态连续学习综述，港中文、清华、UIC联合发布

首个多模态连续学习综述，港中文、清华、UIC联合发布

连续学习（CL）旨在增强机器学习模型的能力，使其能够不断从新数据中学习，而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗忘：当任务按顺序训练时，新的任务训练会严重干扰之前学习的任务的性能，因为不受约束的微调会使参数远离旧任务的最优状态。

来自主题: AI技术研报

5616 点击 2024-11-13 16:02

Scaling Laws终结，量化无用，AI大佬都在审视这篇论文

Scaling Laws终结，量化无用，AI大佬都在审视这篇论文

Scaling Laws终结，量化无用，AI大佬都在审视这篇论文

最近几天，AI 社区都在讨论同一篇论文。 UCSD 助理教授 Dan Fu 说它指明了大模型量化的方向。

来自主题: AI技术研报

5282 点击 2024-11-13 13:41

小米上新二代大模型！窗口长度翻至50倍，平均性能提升超45%

小米上新二代大模型！窗口长度翻至50倍，平均性能提升超45%

小米上新二代大模型！窗口长度翻至50倍，平均性能提升超45%

小米大模型第二代来了！相比第一代，训练数据规模更大、品质更高，训练策略与微调机制上也进行了深入打磨。

来自主题: AI技术研报

6963 点击 2024-11-13 09:12

上一页当前第328页,共444页下一页