AI资讯新闻榜单内容搜索-数据集

全球首次！时序大模型突破十亿参数，华人团队发布Time-MoE，预训练数据达3000亿个时间点

Time-MoE采用了创新的混合专家架构，能以较低的计算成本实现高精度预测。研发团队还发布了Time-300B数据集，为时序分析提供了丰富的训练资源，为各行各业的时间序列预测任务带来了新的解决方案。

来自主题: AI技术研报

5492 点击 2024-10-23 13:40

视频多模态大模型（LMMs）的发展受限于从网络获取大量高质量视频数据。为解决这一问题，我们提出了一种替代方法，创建一个专为视频指令跟随任务设计的高质量合成数据集，名为 LLaVA-Video-178K。

来自主题: AI技术研报

4726 点击 2024-10-21 14:33

大语言模型（LLM）正在推动通信行业向智能化转型，在自动生成网络配置、优化网络管理和预测网络流量等方面展现出巨大潜力。未来，LLM在电信领域的应用将需要克服数据集构建、模型部署和提示工程等挑战，并探索多模态集成、增强机器学习算法和经济高效的模型压缩技术。

来自主题: AI技术研报

5143 点击 2024-10-18 13:40

在大语言模型（LLMs）后训练任务中，由于高质量的特定领域数据十分稀缺，合成数据已成为重要资源。虽然已有多种方法被用于生成合成数据，但合成数据的理论理解仍存在缺口。为了解决这一问题，本文首先对当前流行的合成数据生成过程进行了数学建模。

来自主题: AI技术研报

7614 点击 2024-10-15 18:38

LightRAG通过双层检索范式和基于图的索引策略提高了信息检索的全面性和效率，同时具备对新数据快速适应的能力。在多个数据集上的实验表明，LightRAG在检索准确性和响应多样性方面均优于现有的基线模型，并且在资源消耗和动态环境适应性方面表现更优，使其在实际应用中更为有效和经济。

来自主题: AI技术研报

8038 点击 2024-10-14 16:48

经过三年的努力，ImageNet成为了一个包含1500万张互联网图像的数据集，涵盖了22000个物体类别概念。

来自主题: AI资讯

4840 点击 2024-10-14 15:56

传统的歌声任务，如歌声合成，大多是在利用输入的歌词和乐谱生成高质量的歌声。随着深度学习的发展，人们希望实现可控和能个性化定制的歌声生成。

来自主题: AI技术研报

7393 点击 2024-10-14 10:38

美司法部考虑强制谷歌拆分，解决垄断问题。

来自主题: AI资讯

4775 点击 2024-10-11 14:18

这样一套组合拳打下去，AI厂商大概率就会乖乖向网站付费了。

来自主题: AI资讯

6535 点击 2024-10-08 17:18

解决跨域小样本物体检测问题，入选ECCV 2024。

来自主题: AI技术研报

10278 点击 2024-10-02 11:56