AI资讯新闻榜单内容搜索-大模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 大模型

「马嘉祺」让大模型翻车，而他一年前洗澡时就发现了问题

「马嘉祺」让大模型翻车，而他一年前洗澡时就发现了问题

「马嘉祺」让大模型翻车，而他一年前洗澡时就发现了问题

一家名为脸谱心智（FaceMind）的初创公司就在顶级学术会议 EMNLP 主会上系统性地揭示了这个问题，并给出了解法。更有意思的是，就在「马嘉祺」事件前不到两周，全球最强 AI 公司之一 Anthropic 也在自家产品中悄悄落地了一次高度相关的改造 —— 方向与脸谱心智一年前的论文几乎完全一致。

来自主题: AI技术研报

8015 点击 2026-05-30 10:05

清华系团队给大模型织了一张“智能算力电网”

清华系团队给大模型织了一张“智能算力电网”

清华系团队给大模型织了一张“智能算力电网”

所有人都在比谁的模型参数更大，但真正决定AI能不能落地的，其实是另一件没那么性感的事：一颗Token，能不能被稳定、便宜、规模化地生产出来。死磕这件事的，是一支从中国超级计算体系里走出来的年轻团队，是石科技。

来自主题: AI资讯

10011 点击 2026-05-30 10:03

AI时代，产品经理涌向字节跳动

AI时代，产品经理涌向字节跳动

AI时代，产品经理涌向字节跳动

Google DeepMind研究院姚顺宇最近接受媒体人采访时说：做一个好的产品经理，是一个我现在想不明白该怎么训练AI去做的事。言外之意，AI时代产品经理很难被替代。招聘市场已经给出了答案。根据脉脉2026年1—4月的数据，热招岗位里大模型算法排第一，产品经理排第二，AI产品经理也排到了前五的位置。

来自主题: AI资讯

9776 点击 2026-05-30 00:21

马斯克也拥抱C语言了！大模型训练堆栈抛弃JAX，提速一个数量级

马斯克也拥抱C语言了！大模型训练堆栈抛弃JAX，提速一个数量级

马斯克也拥抱C语言了！大模型训练堆栈抛弃JAX，提速一个数量级

不用JAX，SpaceX正在用C语言编写的全新堆栈训练新模型。而且马斯克本人亲口承认，Grok 5已经用的就是这个新堆栈。按马斯克的说法，这种新堆栈能让大模型训练速度提升一个数量级。

来自主题: AI资讯

8144 点击 2026-05-29 15:10

Claude Opus 4.8蒸馏国产大模型Qwen、DeepSeek，网友晒实锤！

Claude Opus 4.8蒸馏国产大模型Qwen、DeepSeek，网友晒实锤！

Claude Opus 4.8蒸馏国产大模型Qwen、DeepSeek，网友晒实锤！

网上有条帖子炸了，稳定复现，通过 API 问 Claude Opus 4.8 你是什么模型。回答是：Qwen，或者 DeepSeek。重要的事说三遍：必须是通过 API，必须是通过 API，必须是通过 API。因为网页端有系统提示词，会做二次处理。

来自主题: AI资讯

10327 点击 2026-05-29 13:04

刚刚，国产预训练具身大模型开源了，让后训练不再是必选项！

刚刚，国产预训练具身大模型开源了，让后训练不再是必选项！

刚刚，国产预训练具身大模型开源了，让后训练不再是必选项！

2026 年初，国内具身智能赛道掀起了一波开源潮，越来越多团队开始公开自己的视觉-语言-动作（VLA）模型、数据集与训练框架。与此同时，行业竞争也逐渐集中到 benchmark 成绩、任务成功率以及跨任务泛化能力上，尤其是在标准化或已训练任务中的表现。

来自主题: AI技术研报

8756 点击 2026-05-29 09:19

大模型也需要睡觉！让AI打个盹，醒来更聪明

大模型也需要睡觉！让AI打个盹，醒来更聪明

大模型也需要睡觉！让AI打个盹，醒来更聪明

7×24，AI也吃不消。

来自主题: AI技术研报

7919 点击 2026-05-29 09:19

多变量神经缩放定律迈向大一统：Mila联手DeepMind提出UNSL

多变量神经缩放定律迈向大一统：Mila联手DeepMind提出UNSL

多变量神经缩放定律迈向大一统：Mila联手DeepMind提出UNSL

过去的大模型 scaling law 通常回答的是：当模型参数量、数据量和训练计算量增加后，loss 会如何下降。

来自主题: AI技术研报

7186 点击 2026-05-29 09:19

Gamma 联合创始人：你以为只有应届生在怕 AI？大模型公司也一样

Gamma 联合创始人：你以为只有应届生在怕 AI？大模型公司也一样

Gamma 联合创始人：你以为只有应届生在怕 AI？大模型公司也一样

有一个我们很少说出口的预设：AI 带来的恐慌是从下往上递减的。越底层越慌，越顶层越从容。应届生最危险，大厂高管有把握，基础模型公司的人？他们是在写未来，不是在应对它。

来自主题: AI资讯

8921 点击 2026-05-29 09:18

全球首次单机降服万亿巨模DeepSeek-V4！RL后训练框架Orbit开源！

全球首次单机降服万亿巨模DeepSeek-V4！RL后训练框架Orbit开源！

全球首次单机降服万亿巨模DeepSeek-V4！RL后训练框架Orbit开源！

从数学、代码、复杂推理，到多轮工具调用，大模型的很多能力的提升都离不开 RL 后训练。但当模型规模进入 MoE 万亿参数级别之后，RL 不再只是一个算法问题，同时更加是一个系统问题。

来自主题: AI技术研报

7715 点击 2026-05-28 14:51

上一页当前第21页,共547页下一页