AI资讯新闻榜单内容搜索-数据集

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 数据集

LeCun力荐！进化算法淘汰77%低质数据：RIP方法让模型性能狂飙60%

LeCun力荐！进化算法淘汰77%低质数据：RIP方法让模型性能狂飙60%

LeCun力荐！进化算法淘汰77%低质数据：RIP方法让模型性能狂飙60%

近日，Meta等机构发表的论文介绍了一种通过进化算法构造高质量数据集的方法：拒绝指令偏好（RIP），得到了Yann LeCun的转赞。相比未经过滤的数据，使用RIP构建的数据集让模型在多个基准测试中都实现了显著提升。

来自主题: AI技术研报

8745 点击 2025-02-25 14:48

「开源类脑芯片」二代发布！支持反向传播突触学习规则和并行神经元计算

「开源类脑芯片」二代发布！支持反向传播突触学习规则和并行神经元计算

「开源类脑芯片」二代发布！支持反向传播突触学习规则和并行神经元计算

在今年1月《Journal of Supercomputing》上开源的「开源类脑芯片」二代（Polaris 23）完整版本源代码，基于RISC-V架构，支持脉冲神经网络（SNN）和反向传播STDP。该芯片通过并行架构显著提升神经元和突触处理能力，带宽和能效大幅提升，MNIST数据集准确率达91%。

来自主题: AI技术研报

8127 点击 2025-02-21 09:35

小红书等给AI图像检测上难度！数据集均通过人类感知“图灵测试” | ICLR 2025

小红书等给AI图像检测上难度！数据集均通过人类感知“图灵测试” | ICLR 2025

小红书等给AI图像检测上难度！数据集均通过人类感知“图灵测试” | ICLR 2025

AI生成内容已深度渗透至生活的方方面面，从艺术创作到设计领域，再到信息传播与版权保护，其影响力无处不在。

来自主题: AI技术研报

9263 点击 2025-02-20 15:46

微软开放3.1T token高质量数据！通用/代码/数学/问答，全领域超越开源

微软开放3.1T token高质量数据！通用/代码/数学/问答，全领域超越开源

微软开放3.1T token高质量数据！通用/代码/数学/问答，全领域超越开源

RedStone是一个高效构建大规模指定领域数据的处理管道，通过优化数据处理流程，从Common Crawl中提取了RedStone-Web、RedStone-Code、RedStone-Math和RedStone-QA等数据集，在多项任务中超越了现有开源数据集，显著提升了模型性能。

来自主题: AI技术研报

6808 点击 2025-02-18 20:15

打破纪录！谷歌全网扒1000亿图像文本对，ViT大佬坐镇：数据Scaling潜力依旧

打破纪录！谷歌全网扒1000亿图像文本对，ViT大佬坐镇：数据Scaling潜力依旧

打破纪录！谷歌全网扒1000亿图像文本对，ViT大佬坐镇：数据Scaling潜力依旧

史上最大规模视觉语言数据集：1000亿图像-文本对！

来自主题: AI技术研报

6690 点击 2025-02-14 12:10

全球首个「视频教学」基准！南洋理工、CMU发布Video-MMMU

全球首个「视频教学」基准！南洋理工、CMU发布Video-MMMU

全球首个「视频教学」基准！南洋理工、CMU发布Video-MMMU

人类通过课堂学习知识，并在实践中不断应用与创新。那么，多模态大模型（LMMs）能通过观看视频实现「课堂学习」吗？新加坡南洋理工大学S-Lab团队推出了Video-MMMU——全球首个评测视频知识获取能力的数据集，为AI迈向更高效的知识获取与应用开辟了新路径。

来自主题: AI技术研报

6566 点击 2025-02-12 12:01

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

就在刚刚，AIME 2025 I数学竞赛的大模型参赛结果出炉，o3-mini取得78%的最好成绩，DeepSeek R1拿到了65%，取得第四名。然而一位教授却发现，某些1.5B小模型竟也能拿到50%，莫非真的存在数据集污染？

来自主题: AI资讯

9169 点击 2025-02-10 11:21

模型参数作知识通用载体，MergeNet离真正的异构知识迁移更进一步

模型参数作知识通用载体，MergeNet离真正的异构知识迁移更进一步

模型参数作知识通用载体，MergeNet离真正的异构知识迁移更进一步

知识蒸馏通过训练一个紧凑的学生模型来模仿教师模型的 Logits 或 Feature Map，提高学生模型的准确性。迁移学习则通常通过预训练和微调，将预训练阶段在大规模数据集上学到的知识通过骨干网络共享应用于下游任务。

来自主题: AI技术研报

4641 点击 2025-01-28 11:57

TPAMI-2024 | Uni-AdaFocus视频理解框架，让AI学会「划重点」，计算效率提升4-23倍！

TPAMI-2024 | Uni-AdaFocus视频理解框架，让AI学会「划重点」，计算效率提升4-23倍！

TPAMI-2024 | Uni-AdaFocus视频理解框架，让AI学会「划重点」，计算效率提升4-23倍！

Uni-AdaFocus 是一个通用的高效视频理解框架，实现了降低时间、空间、样本三维度冗余性的统一建模。代码和预训练模型已开源，还有在自定义数据集上使用的完善教程，请访问项目链接。

来自主题: AI资讯

7714 点击 2025-01-18 10:03

「知识蒸馏+持续学习」最新综述！哈工大、中科院出品：全新分类体系，十大数据集全面实验

「知识蒸馏+持续学习」最新综述！哈工大、中科院出品：全新分类体系，十大数据集全面实验

「知识蒸馏+持续学习」最新综述！哈工大、中科院出品：全新分类体系，十大数据集全面实验

最新综述论文探讨了知识蒸馏在持续学习中的应用，重点研究如何通过模仿旧模型的输出来减缓灾难性遗忘问题。通过在多个数据集上的实验，验证了知识蒸馏在巩固记忆方面的有效性，并指出结合数据回放和使用separated softmax损失函数可进一步提升其效果。

来自主题: AI技术研报

5039 点击 2025-01-10 13:01

上一页当前第10页,共28页下一页