AI资讯新闻榜单内容搜索-训练

OpenAI附议Ilya预训练终结！“但Scaling Law还没死”

在Ilya探讨完「预训练即将终结」之后，关于Scaling Law的讨论再次引发热议。

来自主题: AI资讯

8452 点击 2024-12-16 09:48

Scaling Law不仅在放缓，而且不一定总是适用！尤其在文本分类任务中，扩大训练集的数据量可能会带来更严重的数据冲突和数据冗余。

来自主题: AI技术研报

7616 点击 2024-12-16 09:43

本文介绍了首个多模态大模型（MLLM）可解释性综述

来自主题: AI技术研报

8686 点击 2024-12-15 19:25

26岁的OpenAI吹哨人，在发出公开指控不到三个月，被发现死在自己的公寓中。法医认定，死因为自杀。那么，他在死前两个月发表的一篇博文中，都说了什么？

来自主题: AI资讯

8615 点击 2024-12-14 14:44

全网独一份o1 pro架构爆料来了！首创自洽性机制打破推理极限，「草莓训练」系统首次揭秘。更令人震惊的是，OpenAI和Anthropic自留Orion、Claude 3.5超大杯，并不是内部失败了，而是它们成为数据生成的秘密武器。

来自主题: AI技术研报

7490 点击 2024-12-14 14:35

ACM SIGKDD（简称 KDD）始于 1989 年，是全球数据挖掘领域历史最悠久、规模最大的国际顶级学术会议。KDD 2025 将于 2025 年 8 月 3 日在加拿大多伦多举办。

来自主题: AI技术研报

8130 点击 2024-12-14 14:00

继李飞飞、Bengio、何恺明之后，在刚刚的NeurIPS 2024中，Ilya Sutskever最新演讲也来了。

来自主题: AI资讯

8492 点击 2024-12-14 13:38

OpenAI谷歌天天刷流量，微软也坐不住了，推出最新小模型Phi-4。参数量仅14B，MMLU性能就和Llama 3.3/ Qwen2.5等70B级别大模型坐一桌。

来自主题: AI技术研报

8757 点击 2024-12-13 15:14

大语言模型（LLMs）通过更多的推理展现出了更强的能力和可靠性，从思维链提示发展到了 OpenAI-o1 这样具有较强推理能力的模型。

来自主题: AI技术研报

6869 点击 2024-12-13 14:40

来自中科院自动化所的研究团队提出了用于大规模复杂三维场景的高效重建算法CityGaussianV2，能够在快速实现训练和压缩的同时，得到精准的几何结构与逼真的实时渲染体验。

来自主题: AI技术研报

8432 点击 2024-12-13 14:32