AI资讯新闻榜单内容搜索-Ai模型

内幕曝光：OpenAI模型坦承不会第六题，3人俩月拿下IMO金牌！

OpenAI在短短两个月内，让AI从挣扎于小学数学题跃升至国际数学奥林匹克（IMO）金牌水平，背后是通用AI技术的突破。

来自主题: AI资讯

8815 点击 2025-08-10 13:51

昨天是个热闹的日子，OpenAI 和 Anthropic 几乎在同一时间发布了自家的新款模型：前者是自 GPT-2 以来重新开源的两款模型 gpt-oss（120b 和 20b），后者是 Claude 系列最强的 Opus 4.1。

来自主题: AI资讯

9334 点击 2025-08-08 12:26

2023年，当整个AI行业都在为“最强大模型”争得头破血流时，亚马逊云科技却洞察到一个关键事实：AI的价值不在于谁的模型最强大，而在于能否为不同场景选择最适合的模型。

来自主题: AI资讯

8241 点击 2025-08-08 11:34

AI模型排行榜分两类：以高考式标准化测试衡量特定能力的客观基准测试（如AAII、MMLU-Pro），以及用户匿名盲测、根据偏好对答案投票排名的人类偏好竞技场（如LMArena）。两者各有优劣和局限性，且排行榜本质是门生意。用户应基于实际需求而非榜单名次选择模型，实用性至上。

来自主题: AI资讯

11015 点击 2025-08-07 10:45

一波未平，一波又起。英伟达Triton推理服务器，被安全研究机构Wiz Research曝光了一组高危漏洞链。

来自主题: AI资讯

8310 点击 2025-08-06 16:53

没等来GPT-5，最先更新的是Gemini 2.5 Deep Think，不愧是你，卷王Gemini。

来自主题: AI产品测评

9489 点击 2025-08-06 16:21

AI科学发现公司Autopoiesis Sciences宣布，其人工智能联合科学家Aristotle X1 Verify在多项基准测试中取得了显著成果，性能超越了所有主流AI模型。据悉，Aristotle X1 Verify在推理基准测试GPQA Diamond中达到了92.4%的准确率

来自主题: AI资讯

10459 点击 2025-08-03 00:25

最近，国产模型开源非常多。 MiniMax、Kimi、Qwen、混元、智谱、昆仑万维等等，都在疯狂开源。

来自主题: AI资讯

10705 点击 2025-07-31 16:02

在AI时代，掌握编程语言成了科研人的「第二外语」？近日，WAIC 2025上，上海科学智能研究院、复旦大学、无限光年联合发布「星河启智科学智能开放平台」，让科学家轻松构建AI模型、发起实验、调度算力，真正成为探索的主角。

来自主题: AI资讯

7394 点击 2025-07-28 17:20

人生第一次的全AI诊疗

来自主题: AI资讯

9835 点击 2025-07-28 11:41