AI资讯新闻榜单内容搜索-SOTA

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: SOTA
直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型

直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型

直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型

近日,斯坦福、UC伯克利等多机构联手发布了开源推理新SOTA——OpenThinker-32B,性能直逼DeepSeek-R1-32B。其成功秘诀在于数据规模化、严格验证和模型扩展。

来自主题: AI技术研报
6045 点击    2025-02-14 11:09
英伟达联手MIT清北发布SANA 1.5!线性扩散Transformer再刷文生图新SOTA

英伟达联手MIT清北发布SANA 1.5!线性扩散Transformer再刷文生图新SOTA

英伟达联手MIT清北发布SANA 1.5!线性扩散Transformer再刷文生图新SOTA

SANA 1.5是一种高效可扩展的线性扩散Transformer,针对文本生成图像任务进行了三项创新:高效的模型增长策略、深度剪枝和推理时扩展策略。这些创新不仅大幅降低了训练和推理成本,还在生成质量上达到了最先进的水平。

来自主题: AI技术研报
10052 点击    2025-02-07 16:05
ICLR 2025|小米新一代Kaldi语音识别算法CR-CTC,纯CTC性能实现SOTA

ICLR 2025|小米新一代Kaldi语音识别算法CR-CTC,纯CTC性能实现SOTA

ICLR 2025|小米新一代Kaldi语音识别算法CR-CTC,纯CTC性能实现SOTA

新一代 Kaldi 团队是由 Kaldi 之父、IEEE fellow、小米集团首席语音科学家 Daniel Povey 领衔的团队,专注于开源语音基础引擎研发,从神经网络声学编码器、损失函数、优化器和解码器等各方面重构语音技术链路,旨在提高智能语音任务的准确率和效率。

来自主题: AI技术研报
5747 点击    2025-02-07 16:02
扩散模型低位量化突破!有效扩散量化的极限推向2-4位,W2A4位宽下FID降低58%,超越SOTA方法

扩散模型低位量化突破!有效扩散量化的极限推向2-4位,W2A4位宽下FID降低58%,超越SOTA方法

扩散模型低位量化突破!有效扩散量化的极限推向2-4位,W2A4位宽下FID降低58%,超越SOTA方法

降低扩散模型生成的计算成本,性能还保持在高水平! 最新研究提出一种用于极低位差分量化的混合精度量化方法。

来自主题: AI技术研报
5988 点击    2025-01-18 14:18
突破瓶颈!北航ETH等首次将扩散模型完全量化至1bit,28倍存储节省+52.7倍效率提升

突破瓶颈!北航ETH等首次将扩散模型完全量化至1bit,28倍存储节省+52.7倍效率提升

突破瓶颈!北航ETH等首次将扩散模型完全量化至1bit,28倍存储节省+52.7倍效率提升

将扩散模型量化到1比特极限,又有新SOTA了! 来自北航、ETH等机构的研究人员提出了一种名为BiDM的新方法,首次将扩散模型(DMs)的权重和激活完全二值化。

来自主题: AI技术研报
7441 点击    2025-01-12 10:42
7B模型数学推理击穿o1,直逼全美20%尖子生!四轮进化,微软华人新作爆火

7B模型数学推理击穿o1,直逼全美20%尖子生!四轮进化,微软华人新作爆火

7B模型数学推理击穿o1,直逼全美20%尖子生!四轮进化,微软华人新作爆火

小模型也能击败o1?微软全华人团队提出rStar-Math算法,三大革命性技术突破,不仅让SLM在数学推理能力上刷新SOTA,更是挤进了全美20%顶尖高中生榜单。

来自主题: AI技术研报
2748 点击    2025-01-10 15:51
1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA

1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA

1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA

1/10训练数据激发高级推理能力!近日,来自清华的研究者提出了PRIME,通过隐式奖励来进行过程强化,提高了语言模型的推理能力,超越了SFT以及蒸馏等方法。

来自主题: AI技术研报
2661 点击    2025-01-08 11:12
爆火出圈!120秒克隆数字人,奥黛丽·赫本等已故明星遗产管理方钟情的AI视频神器,让视频创作像发推文一样简单

爆火出圈!120秒克隆数字人,奥黛丽·赫本等已故明星遗产管理方钟情的AI视频神器,让视频创作像发推文一样简单

爆火出圈!120秒克隆数字人,奥黛丽·赫本等已故明星遗产管理方钟情的AI视频神器,让视频创作像发推文一样简单

Argil采用SOTA deepfake模型的AI数字人技术,专为当今以视频为中心的环境而量身定制,旨在推广视频创作大众化,可满足创作者满足不断提高的质量标准的需求,而无需传统的时间和成本障碍。

来自主题: AI资讯
7460 点击    2025-01-06 10:12