AI资讯新闻榜单内容搜索-模型

稚晖君预告揭晓！智元机器人发布首个通用具身基座模型GO-1

刚填完坑就又埋下“惊喜预告”？？

来自主题: AI技术研报

4798 点击 2025-03-10 14:54

马克·扎克伯格今年正在提升 Meta 人工智能的语音功能，准备从这项快速发展技术中创收。

来自主题: AI资讯

9363 点击 2025-03-10 14:37

推理token减少80%-90%，准确率变化不大，某些任务还能增加。

来自主题: AI技术研报

7103 点击 2025-03-10 14:19

近年来，大语言模型（LLM）的快速发展正推动人工智能迈向新的高度。像 DeepSeek-R1 这样的模型因其强大的理解和生成能力，已经在对话生成、代码编写、知识问答等任务中展现出了卓越的表现。

来自主题: AI技术研报

7154 点击 2025-03-10 14:15

最近， Meta首席AI科学家杨立昆接受海外播客This Is IT 的专访，探讨了深度学习的发展历程、机器学习的三种范式、莫拉维克悖论与AI发展的限制、训练AI模型的资源、AI基础设施投资等话题。

来自主题: AI资讯

5098 点击 2025-03-10 14:09

AGI明年降临？清华人大最新研究给狂热的AI世界泼了一盆冷水：人类距离真正的AGI，还有整整70年！若要实现「自主级智能，需要惊人的10²⁶参数，所需GPU总价竟是苹果市值的4×10⁷倍！

来自主题: AI技术研报

9226 点击 2025-03-10 10:50

最近AI一直是很火的话题，Deepseek也是一夜爆火，但是实际使用下来发现Deepseek好像和其他大模型一样，并没有什么厉害之处，而且官网经常服务器繁忙。

来自主题: AI资讯

9367 点击 2025-03-10 10:39

CMU团队用LCPO训练了一个15亿参数的L1模型，结果令人震惊：在数学推理任务中，它比S1相对提升100%以上，在逻辑推理和MMLU等非训练任务上也能稳定发挥。更厉害的是，要求短推理时，甚至击败了GPT-4o——用的还是相同的token预算！

来自主题: AI技术研报

4954 点击 2025-03-10 10:22

谷歌发布了1000亿文本-图像对数据集，是此前类似数据集的10倍，创下新纪录！基于新数据集，发现预训练Scaling Law，虽然对模型性能提升不明显，但对于小语种等其他指标提升明显。让ViT大佬翟晓华直呼新发现让人兴奋！

来自主题: AI技术研报

6062 点击 2025-03-10 09:52

TimeDistill通过知识蒸馏，将复杂模型（如Transformer和CNN）的预测能力迁移到轻量级的MLP模型中，专注于提取多尺度和多周期模式，显著提升MLP的预测精度，同时保持高效计算能力，为时序预测提供了一种高效且精准的解决方案。

来自主题: AI技术研报

7153 点击 2025-03-10 09:35