AI资讯新闻榜单内容搜索-训练数据

深挖大模型幻觉！哈佛大学最新报告：LLM等价于众包，只是在输出「网络共识」

哈佛大学研究了大型语言模型在回答晦涩难懂和有争议问题时产生「幻觉」的原因，发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出，大模型在处理有广泛共识的问题时表现较好，但在面对争议性或信息不足的主题时则容易产生误导性的回答。

来自主题: AI资讯

5772 点击 2024-10-25 14:51

目前，机器人的训练数据大体上可分为三类：第一类是真实的遥操数据，第二类是高质量的仿真合成数据，第三类是人类的行为数据、其主要源于互联网视频。

来自主题: AI资讯

5077 点击 2024-10-24 11:26

Time-MoE采用了创新的混合专家架构，能以较低的计算成本实现高精度预测。研发团队还发布了Time-300B数据集，为时序分析提供了丰富的训练资源，为各行各业的时间序列预测任务带来了新的解决方案。

来自主题: AI技术研报

6233 点击 2024-10-23 13:40

AI对待每个人类都一视同仁吗？现在OpenAI用53页的新论文揭示：ChatGPT真的会看人下菜碟。根据用户的名字就自动推断出性别、种族等身份特征，并重复训练数据中的社会偏见。

来自主题: AI技术研报

4940 点击 2024-10-16 14:20

Skild AI 是一家位于匹兹堡的初创公司，由两位前 CMU 教授创立，旨在打造具身智能的通用大脑。Skild 宣称其模型展示了无与伦比的泛化和涌现能力，并且有多于竞争对手 1000 倍的训练数据。

来自主题: AI资讯

8199 点击 2024-09-25 20:28

所有模型都是通过在来自互联网的海量数据上进行训练来工作的，然而，随着人工智能越来越多地被用来生成充满垃圾信息的网页，这一过程可能会受到威胁。

来自主题: AI资讯

9317 点击 2024-09-09 10:29

训练代码、中间 checkpoint、训练日志和训练数据都已经开源。

来自主题: AI技术研报

10659 点击 2024-09-05 22:02

训练数据的质量优劣，直接影响人工智能（AI）大模型的能力水平。

来自主题: AI资讯

5052 点击 2024-09-05 09:41

基于公司私有组件生成代码，这个问题的本质是：由于大模型的训练数据集不包含你公司的私有组件数据，因此不能够生成符合公司私有组件库的代码。

来自主题: AI技术研报

12850 点击 2024-09-02 12:42

反垄断案败诉，谷歌或将面临「分家」，一旦与Chrome和安卓操作系统解绑，谷歌该何去何从？

来自主题: AI资讯

12361 点击 2024-08-15 14:37