AI资讯新闻榜单内容搜索-GPT

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GPT
DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro,阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名,仅次于 Claude Opus 4.7。除了真实场景的用户选择,在传统的大模型固定评测榜单上,像是终端能力 Terminal Bench、编程能力 SWE Bench 等,Qwen3.7 Max 的表现也是拿下了国产模型的冠军。

来自主题: AI产品测评
9426 点击    2026-05-28 12:06
GPT-5.5反杀Claude登顶,AI编码旧榜不准了?

GPT-5.5反杀Claude登顶,AI编码旧榜不准了?

GPT-5.5反杀Claude登顶,AI编码旧榜不准了?

一个号称「零污染」的新基准 DeepSWE,用113道原创题撕开了旧编程榜单的遮羞布。

来自主题: AI资讯
8780 点击    2026-05-28 10:51
实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了

实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了

实锤!GPT-5.5「降智」被抓,OpenAI官方文档认了

GPT-5.5被扒出「假思考」,用两小时就被偷偷换成mini,200美元月费买了个「薛定谔的脑子」。Trace命令实锤,官方文档亲自认领。往后有纷纷吐槽:OpenAI,你糊弄谁呢?

来自主题: AI资讯
8810 点击    2026-05-27 23:48
DeepSeek陈德里开发自动研究Skill,用DeliAutoResearch写一篇论文人类只动脑2小时

DeepSeek陈德里开发自动研究Skill,用DeliAutoResearch写一篇论文人类只动脑2小时

DeepSeek陈德里开发自动研究Skill,用DeliAutoResearch写一篇论文人类只动脑2小时

DeepSeek研究员陈德里,在个人博客更新一篇研究综述论文。用的是他自己的技能DeliAutoResearch,DeepSeek-V4-Pro研究和写作,GPT-Image2画图。论文共迭代6次(V1:4 次,V2:1 次,V3:1 次),总耗时6天,进行了约108轮Agent调用,消耗64.8万token,写了2234行LaTeX代码。

来自主题: AI资讯
9776 点击    2026-05-27 09:47
GPT-5.6泄露了!

GPT-5.6泄露了!

GPT-5.6泄露了!

最近,GPT-5.6泄露了!150万Token+神级极简UI,下月紧急上线,奥特曼的「超级智能体」要掀翻整个硅谷?6月AI大战,已经提前爆发了。

来自主题: AI资讯
10881 点击    2026-05-25 22:56
胜率直逼人类大师!这套Agent揭开中国AI「玄学真相」

胜率直逼人类大师!这套Agent揭开中国AI「玄学真相」

胜率直逼人类大师!这套Agent揭开中国AI「玄学真相」

没有信息泄漏的专业术数题库面前,Claude、GPT等主流模型集体「翻车」。但一个叫Tianfu Agent的系统,却一举将准确率提升至50%,逼近本届术数大赛人类Top20选手的53.5%平均水平。

来自主题: AI资讯
5906 点击    2026-05-25 15:11
给AlphaFold2开刀!GPT-5.5自进化,狂肝150小时改进蛋白质折叠

给AlphaFold2开刀!GPT-5.5自进化,狂肝150小时改进蛋白质折叠

给AlphaFold2开刀!GPT-5.5自进化,狂肝150小时改进蛋白质折叠

有人晒出开源项目:GPT-5.5连续狂飙150小时,自主挑战诺奖级AlphaFold2!它用拓扑「单纯形」重构蛋白质折叠逻辑,虽然性能暂未登顶,却展示了AI科学家的恐怖潜力:秒回滚、零情绪、全自动进化。科研范式,真要变天了。

来自主题: AI资讯
9748 点击    2026-05-24 10:37
独家|ChatGPT核心贡献者姜旭归国创业:把LLM的Scaling带到具身智能

独家|ChatGPT核心贡献者姜旭归国创业:把LLM的Scaling带到具身智能

独家|ChatGPT核心贡献者姜旭归国创业:把LLM的Scaling带到具身智能

姜旭是少数完整参与过 OpenAI 大模型核心技术演进的华人创业者之一。2019 至 2023 年间,他经历了 GPT 系列能力爆发最关键的阶段,工作横跨底层训练 infra、大规模预训练、RLHF 对齐算法与数据构建等核心链路。

来自主题: AI资讯
10383 点击    2026-05-22 10:26
Gemini 3.5 Flash vs GPT 5.5 实测,全网首发!

Gemini 3.5 Flash vs GPT 5.5 实测,全网首发!

Gemini 3.5 Flash vs GPT 5.5 实测,全网首发!

昨天,想必大家都被 Google IO 大会刷屏了。

来自主题: AI产品测评
9534 点击    2026-05-22 09:56