超10万亿Tokens的高质量数据集是怎么炼成的?专访中国电信天翼AI阮宜龙 超10万亿Tokens的高质量数据集是怎么炼成的?专访中国电信天翼AI阮宜龙 关键词: AI新闻,电信AI,天翼AI,阮宜龙,数据集 正所谓“得数据者得天下”,这家央企算是把高质量数据集给玩明白了——超过10万亿tokens的通用大模型语料数据,以及覆盖14个关键行业的专业数据集,总存储量高达350TB! 来自主题: AI资讯 7034 点击 2025-09-26 10:59