AI资讯新闻榜单内容搜索-GPT-5.2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GPT-5.2
OpenAI测谎13款大模型:Claude 3.7封神,GPT-5.2近乎失控!

OpenAI测谎13款大模型:Claude 3.7封神,GPT-5.2近乎失控!

OpenAI测谎13款大模型:Claude 3.7封神,GPT-5.2近乎失控!

OpenAI的最新研究揭示了一个反直觉的真相:越强大的推理模型,越管不住自己的「脑子」。在CoT-Control套件测试的13款前沿模型中,DeepSeek R1控制自身思维链的成功率仅为0.1%,Claude Sonnet 4.5也只有2.7%。

来自主题: AI资讯
8513 点击    2026-03-09 15:08
32B逆袭GPT-5.2:首个端到端GPU编程智能体框架StitchCUDA问世

32B逆袭GPT-5.2:首个端到端GPU编程智能体框架StitchCUDA问世

32B逆袭GPT-5.2:首个端到端GPU编程智能体框架StitchCUDA问世

现有的 LLM 自动化 CUDA 方法大多只能优化单个 Kernel,面对完整的端到端 GPU 程序(如整个 VisionTransformer 推理)往往束手无策。

来自主题: AI技术研报
7566 点击    2026-03-05 14:28
刚刚,DeepSeek V4基准测试泄露!疑似明天发布,全场惊呼新王归来

刚刚,DeepSeek V4基准测试泄露!疑似明天发布,全场惊呼新王归来

刚刚,DeepSeek V4基准测试泄露!疑似明天发布,全场惊呼新王归来

DeepSeek V4,据说明天就要上线了?这是首个匹敌顶尖闭源模型的开源模型,被网友评为「一鲸落万物生」。泄露的基准测试显示,它在SWE-bench Verified上取得了83.7%,已经超越Opus 4.5和GPT-5.2!

来自主题: AI资讯
9351 点击    2026-02-16 20:04
GPT-5.2改写粒子物理教科书!人类手算32项算不出,AI一行公式搞定

GPT-5.2改写粒子物理教科书!人类手算32项算不出,AI一行公式搞定

GPT-5.2改写粒子物理教科书!人类手算32项算不出,AI一行公式搞定

粒子物理教科书几十年的结论被推翻,GPT-5.2干的。这已经是GPT-5.2在基础科学领域做出原创贡献的第三个公开案例。 此前GPT-5独立证明了一道存在45年的埃尔德什数论猜想,还在非线性量子力学与相对论兼容性的理论物理论文中提出了核心方法论框架。

来自主题: AI资讯
8110 点击    2026-02-15 16:55
像Vibe Coding一样写论文!OpenAI发布免费科研写作平台

像Vibe Coding一样写论文!OpenAI发布免费科研写作平台

像Vibe Coding一样写论文!OpenAI发布免费科研写作平台

就在今天,OpenAI给肝论文的科研党送上了一份大礼——免费的科研写作平台Prism。 它把GPT-5.2模型深度集成到了在线LaTeX编辑器中,能够直接理解论文的完整结构、公式推导与参考文献。

来自主题: AI资讯
8600 点击    2026-01-28 13:09
OpenAI凌晨放大招,免费Prism颠覆科研!从摘要到致谢,GPT-5.2包圆

OpenAI凌晨放大招,免费Prism颠覆科研!从摘要到致谢,GPT-5.2包圆

OpenAI凌晨放大招,免费Prism颠覆科研!从摘要到致谢,GPT-5.2包圆

深夜,OpenAI正式祭出新一代科研利器——Prism,由GPT-5.2加持,专为写作和协作而生。它是一个基于云的「AI原生」LaTeX工作区,不限项目和协作的人数。

来自主题: AI资讯
8957 点击    2026-01-28 08:00
憋了4个月,阿里最大最强模型Qwen3-Max-Thinking正式版发布!附一手实测

憋了4个月,阿里最大最强模型Qwen3-Max-Thinking正式版发布!附一手实测

憋了4个月,阿里最大最强模型Qwen3-Max-Thinking正式版发布!附一手实测

阿里巴巴推出了Qwen3-Max-Thinking,这是阿里千问系列目前能力最强的旗舰级推理模型,在19项权威基准测试中,Qwen3-Max-Thinking跟GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro等顶尖模型打得有来有回,搭配测试时扩展(TTS)能力后,能在不少基准测试上达到SOTA。

来自主题: AI资讯
9710 点击    2026-01-27 11:21
谷歌Gemini在“搜索”领域仍具有绝对统治力。深度研究智能体到底该怎么选?OSU & Amazon最新

谷歌Gemini在“搜索”领域仍具有绝对统治力。深度研究智能体到底该怎么选?OSU & Amazon最新

谷歌Gemini在“搜索”领域仍具有绝对统治力。深度研究智能体到底该怎么选?OSU & Amazon最新

面对琳琅满目的Deep Research Agent(深度研究智能体),究竟该如何选型?本文基于OSU与Amazon最新发布的MMDR-Bench论文,为您提供一份经过严谨科学验证的“避坑指南”。结论先行:综合任务首选谷歌Gemini Deep Research,而涉及计算机科学与数据结构的硬核任务,GPT-5.2依然是专家首选。

来自主题: AI技术研报
7678 点击    2026-01-26 11:29