AI资讯新闻榜单内容搜索-语料库

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 语料库
工信部等三部门:多级联动建立国家工业基础大数据库、行业数据库

工信部等三部门:多级联动建立国家工业基础大数据库、行业数据库

工信部等三部门:多级联动建立国家工业基础大数据库、行业数据库

据工业和信息化部网站25日消息,工业和信息化部、国务院国有资产监督管理委员会、中华全国工商业联合会日前印发《制造业企业数字化转型实施指南》。

来自主题: AI监管政策
3475 点击    2024-12-26 14:05
AI数据告急,大厂盯上廉价年轻人

AI数据告急,大厂盯上廉价年轻人

AI数据告急,大厂盯上廉价年轻人

说好的AI给人类打工呢? 为了拿到新数据、训练AI大模型,字节等互联网大厂正在亲自下场,以单次300元不等的价格招募“AI录音员”,定制语料库。

来自主题: AI资讯
4611 点击    2024-09-04 09:57
LLM的「母语」是什么?

LLM的「母语」是什么?

LLM的「母语」是什么?

在以英语为主的语料库上训练的多语言LLM,是否使用英语作为内部语言?对此,来自EPFL的研究人员针对Llama 2家族进行了一系列实验。

来自主题: AI技术研报
8796 点击    2024-06-03 10:53
AI开始接手:游戏,社交与产业变革前夜的语料库战争

AI开始接手:游戏,社交与产业变革前夜的语料库战争

AI开始接手:游戏,社交与产业变革前夜的语料库战争

无论投资界还是产业界,已经没有人质疑AI的兴起是大事件。但无论是谁,奥特曼或者霍夫曼,都无法确定AI领域的投资最终如何获利。

来自主题: AI资讯
8367 点击    2024-05-22 13:52
小模型性能饱和、表现不佳,根源是因为Softmax?

小模型性能饱和、表现不佳,根源是因为Softmax?

小模型性能饱和、表现不佳,根源是因为Softmax?

语言建模领域的最新进展在于在极大规模的网络文本语料库上预训练高参数化的神经网络。在实践中,使用这样的模型进行训练和推断可能会成本高昂,这促使人们使用较小的替代模型。然而,已经观察到较小的模型可能会出现饱和现象,表现为在训练的某个高级阶段性能下降并趋于稳定。

来自主题: AI技术研报
10070 点击    2024-05-03 20:58
姚前:行业大模型语料库建设与治理

姚前:行业大模型语料库建设与治理

姚前:行业大模型语料库建设与治理

大模型语料是指用于训练和评估大模型的一系列文本、语音或其他模态的数据。

来自主题: AI技术研报
4576 点击    2024-04-28 11:12
姚前:行业大模型语料库建设与治理

姚前:行业大模型语料库建设与治理

姚前:行业大模型语料库建设与治理

大模型语料是指用于训练和评估大模型的一系列文本、语音或其他模态的数据。语料规模和质量对大模型性能以及应用的深度、广度有着至关重要的影响。

来自主题: AI技术研报
8238 点击    2024-04-26 16:56
没想到吧,中文互联网上最好的大模型语料库是:弱智吧

没想到吧,中文互联网上最好的大模型语料库是:弱智吧

没想到吧,中文互联网上最好的大模型语料库是:弱智吧

如果让你在互联网上给大模型选一本中文教材,你会去哪里取材?是知乎,是豆瓣,还是微博?一个研究团队为了构建高质量的中文指令微调数据集,对这些社交媒体进行了测试,想找到训练大模型最好的中文预料,结果答案保证让你大跌眼镜——

来自主题: AI资讯
6557 点击    2024-04-04 15:47
“太令”司法大模型,提供罪名预测及量刑建议

“太令”司法大模型,提供罪名预测及量刑建议

“太令”司法大模型,提供罪名预测及量刑建议

大连理工大学信息检索研究室在始智AI wisemodel.cn开源社区发布了司法大模型--太令(TaiLing)1.0版,“太令”是专门为司法领域定制的大语言模型,其训练基础是庞大的通用中文语料库,并结合了裁判文书、合同、司法考试材料以及司法问答等专业司法数据进行深度训练。

来自主题: AI资讯
7920 点击    2024-03-28 11:17
为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用

为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用

为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用

当前智能对话模型的发展中,强大的底层模型起着至关重要的作用。这些先进模型的预训练往往依赖于高质量且多样化的语料库,而如何构建这样的语料库,已成为行业中的一大挑战。

来自主题: AI资讯
1978 点击    2024-01-12 17:31