AI资讯新闻榜单内容搜索-o3

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: o3

苹果再发论文：精准定位LLM幻觉，GPT-5、o3都办不到

苹果再发论文：精准定位LLM幻觉，GPT-5、o3都办不到

苹果再发论文：精准定位LLM幻觉，GPT-5、o3都办不到

论文提出的方法名为 RL4HS，它使用了片段级奖励（span-level rewards）和类别感知的 GRPO（Class-Aware Group Relative Policy Optimization），从而避免模型偷懒、只输出无错误预测。

来自主题: AI资讯

9616 点击 2025-10-07 22:11

全新合成框架SOTA：强化学习当引擎，任务合成当燃料，蚂蚁港大联合出品

全新合成框架SOTA：强化学习当引擎，任务合成当燃料，蚂蚁港大联合出品

全新合成框架SOTA：强化学习当引擎，任务合成当燃料，蚂蚁港大联合出品

蚂蚁通用人工智能中心自然语言组联合香港大学自然语言组（后简称“团队”）推出PromptCoT 2.0，要在大模型下半场押注任务合成。实验表明，通过“强起点、强反馈”的自博弈式训练，PromptCoT 2.0可以让30B-A3B模型在一系列数学代码推理任务上实现新的SOTA结果，达到和DeepSeek-R1-0528, OpenAI o3, Gemini 2.5 Pro等相当的表现。

来自主题: AI技术研报

8198 点击 2025-10-01 17:12

让大模型合成检查器：UIUC团队挖出Linux内核90余个长期潜伏漏洞

让大模型合成检查器：UIUC团队挖出Linux内核90余个长期潜伏漏洞

让大模型合成检查器：UIUC团队挖出Linux内核90余个长期潜伏漏洞

最近的报道指出，OpenAI 的 o3 模型已经在 Linux 内核中发现了一个零日漏洞；而本文的 KNighter 更进一步，通过自动生成静态分析检查器，把模型的洞察沉淀为工程可用、用户可见的逻辑规则，实现了规模化的软件漏铜、缺陷挖掘。

来自主题: AI技术研报

8007 点击 2025-09-28 16:59

故意“装菜”答错问题，AI已能识别自己“正在被测试”丨OpenAI新研究

故意“装菜”答错问题，AI已能识别自己“正在被测试”丨OpenAI新研究

故意“装菜”答错问题，AI已能识别自己“正在被测试”丨OpenAI新研究

OpenAI携手APOLLO的新研究发现，大模型会对指令阳奉阴违，为了达成目的故意答错问题、暗中修改数据或者操作记录来掩盖自己的违规行为……比如，o3模型在化学测试中，通过推理得出如果正确率超过50%将不会被部署的结论后，

来自主题: AI技术研报

9809 点击 2025-09-23 16:34

3D生成到达3.0阶段，不止提升行业渗透率，也正催生3D原生新玩法 | 对话3D生成平台Tripo

3D生成到达3.0阶段，不止提升行业渗透率，也正催生3D原生新玩法 | 对话3D生成平台Tripo

3D生成到达3.0阶段，不止提升行业渗透率，也正催生3D原生新玩法 | 对话3D生成平台Tripo

作为AI驱动的3D建模平台，Tripo（https://www.tripo3d.ai）已在全球覆盖超300万专业开发者，AI 3D原生模型数量超过4000万，中小用户超4万，并推出了一站式AI 3D工作台Tripo Studio

来自主题: AI资讯

9652 点击 2025-09-21 11:11

GPT-5惨遭零分打脸，顶级AI全军覆没！奥特曼AI博士级能力神话破灭

GPT-5惨遭零分打脸，顶级AI全军覆没！奥特曼AI博士级能力神话破灭

GPT-5惨遭零分打脸，顶级AI全军覆没！奥特曼AI博士级能力神话破灭

顶级大模型在AAI提出的FormulaOne基准集体翻车：三层难度递进，GPT-5进阶题仅约4%正确，最深层零分；Grok 4、o3 Pro全部失手。该基准以图上MSO逻辑与动态规划生成问题，贴近路径规划等现实优化，旨在衡量超越竞赛编程的算法推理深度。

来自主题: AI技术研报

7870 点击 2025-09-17 09:30

全新开源模型复现o3视觉推理，无需大量训练即可实现深度思考

全新开源模型复现o3视觉推理，无需大量训练即可实现深度思考

全新开源模型复现o3视觉推理，无需大量训练即可实现深度思考

OpenAI o3的多轮视觉推理，有开源平替版了。并且，与先前局限于1-2轮对话的视觉语言模型（VLM）不同，它在训练限制轮数只有6轮的情况下，测试阶段能将思考轮数扩展到数十轮。

来自主题: AI技术研报

9369 点击 2025-09-16 10:02

陶哲轩都惊了！o3首战「AI奥数」碾压夺冠，开源军团仅差5分狂追OpenAI

陶哲轩都惊了！o3首战「AI奥数」碾压夺冠，开源军团仅差5分狂追OpenAI

陶哲轩都惊了！o3首战「AI奥数」碾压夺冠，开源军团仅差5分狂追OpenAI

AI界奥数杯，重启了！OpenAI o3首次杀入赛场，在算力拉满的情况下，直接以最高47分的逆天成绩炸翻全场。值得一提的是，前五模型合并得分仅与o3差5分，开源与闭源差距再次缩小。

来自主题: AI资讯

8767 点击 2025-09-08 10:48

蚂蚁专用模型超越o3！仅用2K训练样本刷新医疗AI榜单纪录

蚂蚁专用模型超越o3！仅用2K训练样本刷新医疗AI榜单纪录

蚂蚁专用模型超越o3！仅用2K训练样本刷新医疗AI榜单纪录

不卷参数的专业模型，会不会被通用大模型取代？在医疗领域，这个疑问正在被打破。

来自主题: AI资讯

8094 点击 2025-08-29 15:56

GPT-5通关《宝可梦水晶》创纪录！9517步击败赤爷，效率碾压o3三倍！

GPT-5通关《宝可梦水晶》创纪录！9517步击败赤爷，效率碾压o3三倍！

GPT-5通关《宝可梦水晶》创纪录！9517步击败赤爷，效率碾压o3三倍！

又是一场酣畅淋漓的战斗！宝可梦主播GPT-5在直播间鏖战一小时，成功击败赤爷（Red），公屏瞬间刷满GG（Good Game）。

来自主题: AI资讯

9155 点击 2025-08-26 19:54

上一页当前第2页,共18页下一页