AI资讯新闻榜单内容搜索-推理模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 推理模型
OpenAI夺金IOI,但输给3位中国高中生

OpenAI夺金IOI,但输给3位中国高中生

OpenAI夺金IOI,但输给3位中国高中生

刚刚,OpenAI官宣:IOI金牌收入囊中! 其推理模型在今年IOI线上竞赛中成绩刷新纪录: 总分533.29,在全球330名人类选手中总排名位列第六;而在所有AI参赛者中,稳居第一。

来自主题: AI资讯
7417 点击    2025-08-12 17:34
刚刚,OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺得IMO金牌

刚刚,OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺得IMO金牌

刚刚,OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺得IMO金牌

一觉醒来,OpenAI 的大模型又完成了一项壮举!在全球顶级编程赛事之一 ——2025 年国际信息学奥林匹克(IOI)中,OpenAI 的推理模型取得了足以摘得金牌的高分,并在 AI 参赛者中排名第一!

来自主题: AI资讯
7968 点击    2025-08-12 13:07
41个榜单SOTA!智谱最新开源GLM-4.5V实测:看图猜地址、视频秒变代码

41个榜单SOTA!智谱最新开源GLM-4.5V实测:看图猜地址、视频秒变代码

41个榜单SOTA!智谱最新开源GLM-4.5V实测:看图猜地址、视频秒变代码

智谱基于GLM-4.5打造的开源多模态视觉推理模型GLM-4.5V,在42个公开榜单中41项夺得SOTA!其功能涵盖图像、视频、文档理解、Grounding、地图定位、空间关系推理、UI转Code等。

来自主题: AI资讯
6816 点击    2025-08-12 13:04
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus

Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus

Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus

三天不开源,Qwen团队手就痒。 昨天深夜再次放出两个端侧模型: Qwen3-4B-Instruct-2507:非推理模型,大幅提升通用能力 Qwen3-4B-Thinking-2507:高级推理模型,专为专家级任务设计

来自主题: AI资讯
6873 点击    2025-08-07 12:12
就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1

就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1

就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1

你会掏钱吗?你说巧不巧,就在 Sam Altman 官宣两个开源推理模型之前的半个小时,却被 Anthropic 抢先一步,发布了新模型 Claude Opus 4.1。

来自主题: AI资讯
6013 点击    2025-08-06 14:01
GPT-5难产内幕曝光!核心团队遭挖空,推理魔咒难破,靠英伟达续命

GPT-5难产内幕曝光!核心团队遭挖空,推理魔咒难破,靠英伟达续命

GPT-5难产内幕曝光!核心团队遭挖空,推理魔咒难破,靠英伟达续命

GPT-5,曾经差点难产?这条诞生路,简直是烈火炼真金。一边是人才出走、小扎截胡、团队内部陷入混乱,另一边,推理模型魔咒让研究者苦恼不已,项目甚至一度停摆。外媒曝出这期GPT-5诞生内幕,可谓亮点满满,干货十足。

来自主题: AI资讯
7371 点击    2025-08-02 16:34
一个模型超了DeepSeek R1、V3,参数671B,成本不到350万美元

一个模型超了DeepSeek R1、V3,参数671B,成本不到350万美元

一个模型超了DeepSeek R1、V3,参数671B,成本不到350万美元

Deep Cogito,一家鲜为人知的 AI 初创公司,总部位于旧金山,由前谷歌员工创立,如今开源的四款混合推理模型,受到大家广泛关注。

来自主题: AI资讯
6924 点击    2025-08-02 13:38
又一SOTA级开源模型!阶跃Step-3多模态推理登顶,百万token解码成本不到4毛钱

又一SOTA级开源模型!阶跃Step-3多模态推理登顶,百万token解码成本不到4毛钱

又一SOTA级开源模型!阶跃Step-3多模态推理登顶,百万token解码成本不到4毛钱

又一个SOTA基础模型开源,而且依然是国产。 刚刚,阶跃星辰兑现了WAIC上的承诺,将最新多模态推理模型Step-3正式开源! 在MMMU等多个多模态榜单上,它一现身就取得了开源多模态推理模型新SOTA的成绩。

来自主题: AI技术研报
6584 点击    2025-08-01 12:52
首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练

首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练

首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练

新一代大型推理模型,如 OpenAI-o3、DeepSeek-R1 和 Kimi-1.5,在复杂推理方面取得了显著进展。该方向核心是一种名为 ZERO-RL 的训练方法,即采用可验证奖励强化学习(RLVR)逐步提升大模型在强推理场景 (math, coding) 的 pass@1 能力。

来自主题: AI技术研报
5872 点击    2025-07-28 10:36
刚刚,阿里发布全球最强开源模型,AI 圈迎来「中国时刻」

刚刚,阿里发布全球最强开源模型,AI 圈迎来「中国时刻」

刚刚,阿里发布全球最强开源模型,AI 圈迎来「中国时刻」

就在刚刚,阿里正式发布全球最强开源推理模型——Qwen3-235B-A22B-Thinking-2507。就在刚刚,阿里正式发布全球最强开源推理模型——Qwen3-235B-A22B-Thinking-2507。

来自主题: AI资讯
8068 点击    2025-07-25 23:11