AI资讯新闻榜单内容搜索-合成数据

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 合成数据
数据集蒸馏,连发两篇顶会!10%样本实现全量性能,鲁棒不失真

数据集蒸馏,连发两篇顶会!10%样本实现全量性能,鲁棒不失真

数据集蒸馏,连发两篇顶会!10%样本实现全量性能,鲁棒不失真

数据集蒸馏是一种用少量合成数据替代全量数据训练模型的技术,能让模型高效又节能。WMDD和GUARD两项研究分别解决了如何保留原始数据特性并提升模型对抗扰动能力的问题,使模型在少量数据上训练时既准确又可靠。

来自主题: AI技术研报
8520 点击    2025-10-27 17:16
Efficiency Law, 物理精确世界模型,及世界模型引擎驱动的具身智能学习新范式

Efficiency Law, 物理精确世界模型,及世界模型引擎驱动的具身智能学习新范式

Efficiency Law, 物理精确世界模型,及世界模型引擎驱动的具身智能学习新范式

2025 年秋的具身智能赛道正被巨头动态点燃:特斯拉上海超级工厂宣布 Optimus 2.0 量产下线,同步开放开发者平台提供运动控制与环境感知 SDK,试图通过生态共建破解数据孤岛难题;英伟达则在 SIGGRAPH 大会抛出物理 AI 全栈方案,其 Omniverse 平台结合 Cosmos 世界模型可生成高质量合成数据,直指真机数据短缺痛点。

来自主题: AI技术研报
8133 点击    2025-10-27 17:05
仅100种子题,合成数据质量超GPT-5,阿里、上交提出Socratic-Zero框架

仅100种子题,合成数据质量超GPT-5,阿里、上交提出Socratic-Zero框架

仅100种子题,合成数据质量超GPT-5,阿里、上交提出Socratic-Zero框架

阿里巴巴与上海交通大学 EPIC Lab 联合提出 Socratic-Zero,一个完全无外部数据依赖的自主推理训练框架。该方法仅从 100 个种子问题出发,通过三个智能体的协同进化,自动生成高质量、难度自适应的课程,并持续提升模型推理能力。

来自主题: AI技术研报
6970 点击    2025-10-24 16:45
NIPS 2025 Spotlight | 港大提出TreeSynth方法,一句话生成百万规模数据集

NIPS 2025 Spotlight | 港大提出TreeSynth方法,一句话生成百万规模数据集

NIPS 2025 Spotlight | 港大提出TreeSynth方法,一句话生成百万规模数据集

“TreeSynth” 就这样起源于作者们最初的构想:“如何通过一句任务描述生成海量数据,完成模型训练?” 同时,大规模 scalibility 对合成数据的多样性提出了新的要求。

来自主题: AI技术研报
7619 点击    2025-10-03 14:45
刚刚,字节开源Seed-OSS-36B模型,512k上下文

刚刚,字节开源Seed-OSS-36B模型,512k上下文

刚刚,字节开源Seed-OSS-36B模型,512k上下文

开源赛道也是热闹了起来。 就在深夜,字节跳动 Seed 团队正式发布并开源了 Seed-OSS 系列模型,包含三个版本: Seed-OSS-36B-Base(含合成数据) Seed-OSS-36B-Base(不含合成数据) Seed-OSS-36B-Instruct(指令微调版)

来自主题: AI资讯
6668 点击    2025-08-21 11:48
4o-mini华人领队也离职了,这次不怪小扎

4o-mini华人领队也离职了,这次不怪小扎

4o-mini华人领队也离职了,这次不怪小扎

哦豁,OpenAI奥特曼又痛失一员大将。 Kevin Lu,领导4o-mini发布,并参与o1-mini、o3发布,主要研究强化学习、小模型和合成数据。

来自主题: AI资讯
6903 点击    2025-08-19 11:20
合成数据>人工数据,绝对性能暴涨超10个点!仅需任务定义,高效微调大模型

合成数据>人工数据,绝对性能暴涨超10个点!仅需任务定义,高效微调大模型

合成数据>人工数据,绝对性能暴涨超10个点!仅需任务定义,高效微调大模型

基础模型严重依赖大规模、高质量人工标注数据来学习适应新任务、领域。为解决这一难题,来自北京大学、MIT等机构的研究者们提出了一种名为「合成数据强化学习」(Synthetic Data RL)的通用框架。该框架仅需用户提供一个简单的任务定义,即可全自动地生成高质量合成数据。

来自主题: AI技术研报
9017 点击    2025-06-24 16:13
从 AI 招聘到数据标注,Mercor 能否打造下一个 Scale AI?

从 AI 招聘到数据标注,Mercor 能否打造下一个 Scale AI?

从 AI 招聘到数据标注,Mercor 能否打造下一个 Scale AI?

Mercor 所处的赛道是 AI 中一个关键且尚未被充分满足的供需交叉点:下一代 AI 模型对高质量、垂直领域专家级 Human Data 的需求,以及相关人才稀缺所带来的供需不平衡。合成数据无法完全替代 Human Data,尤其是在特定领域知识和复杂判断方面。AI 模型的突破性进展高度依赖于垂直领域专家的“人类智能输入”。

来自主题: AI资讯
7777 点击    2025-06-14 16:23
比Sora更疯狂!英伟达AI让机器人「做梦」修炼,无师自通直接上岗

比Sora更疯狂!英伟达AI让机器人「做梦」修炼,无师自通直接上岗

比Sora更疯狂!英伟达AI让机器人「做梦」修炼,无师自通直接上岗

当OpenAI、谷歌还在用Sora等AI模型「拍视频」,英伟达直接用视频生成模型让机器人「做梦」学习!新方法DreamGen不仅让机器人掌握从未见过的新动作,还能泛化至完全陌生的环境。利用新方法合成数据直接暴涨333倍。机器人终于「做梦成真」了!

来自主题: AI技术研报
7963 点击    2025-05-22 10:15