AI资讯新闻榜单内容搜索-编程

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 编程
GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的

GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的

GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的

别急着用GPT-5编程了,可能它能力没有你想象中那么强。 有人发现,官方测试编程能力用的SWE-bench Verified,但货不对板,只用了477个问题。

来自主题: AI资讯
6416 点击    2025-08-12 17:07
GPT-5 vs Claude Opus 4.1:编程能力测评

GPT-5 vs Claude Opus 4.1:编程能力测评

GPT-5 vs Claude Opus 4.1:编程能力测评

OpenAI 发布了 GPT-5,我在公众号里、社群里、论坛里,很多地方都在刷屏一个消息:GPT-5 来了,而且在编程能力上“强得可怕”。

来自主题: AI产品测评
6358 点击    2025-08-12 16:52
刚刚,OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺得IMO金牌

刚刚,OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺得IMO金牌

刚刚,OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺得IMO金牌

一觉醒来,OpenAI 的大模型又完成了一项壮举!在全球顶级编程赛事之一 ——2025 年国际信息学奥林匹克(IOI)中,OpenAI 的推理模型取得了足以摘得金牌的高分,并在 AI 参赛者中排名第一!

来自主题: AI资讯
7840 点击    2025-08-12 13:07
GPT-oss太离谱:无提示自行想象编程问题,还重复求解5000次

GPT-oss太离谱:无提示自行想象编程问题,还重复求解5000次

GPT-oss太离谱:无提示自行想象编程问题,还重复求解5000次

GPT-oss放飞自我了?!居然出现了明显的幻觉行为。 在没有提示词的情况下,消耗超过30000个token凭空想出一个问题,还反复求解了5000多次?!

来自主题: AI资讯
5462 点击    2025-08-12 11:52
OpenAI惊人自曝:GPT-5真「降智」了!但重现「神之一手」,剑指代码王座

OpenAI惊人自曝:GPT-5真「降智」了!但重现「神之一手」,剑指代码王座

OpenAI惊人自曝:GPT-5真「降智」了!但重现「神之一手」,剑指代码王座

GPT-5智商测试,仅拿下了70分?全网狂吐槽「降智」背后的真相,竟是「路由」决定了模型的智能。想要解锁神级GPT-5,秘诀在于prompt。这不,医学家借助GPT-5重现了「神之一手」时刻。

来自主题: AI资讯
5651 点击    2025-08-11 11:15
用户集体大逃亡!Cursor“自杀式政策”致口碑崩塌:“补贴”换来的王座,正被反噬撕碎

用户集体大逃亡!Cursor“自杀式政策”致口碑崩塌:“补贴”换来的王座,正被反噬撕碎

用户集体大逃亡!Cursor“自杀式政策”致口碑崩塌:“补贴”换来的王座,正被反噬撕碎

很多开发者开始吐槽和弃用 Cursor。Web 工程师 Tom Byrer 吐槽道,“我让 Cursor 使用某个仓库的最新版本,它却安装了一个 6 个月前的版本,漏掉了 60 个更新。我发给它 GitHub 仓库链接,结果它用了 4 个月前的版本。我发了 NPM 项目的页面链接,它还是用了 4 个月前的版本。”

来自主题: AI资讯
5682 点击    2025-08-10 16:28
5个月4亿营收!Claude Code负责人重磅访谈,首次分享更多细节内幕

5个月4亿营收!Claude Code负责人重磅访谈,首次分享更多细节内幕

5个月4亿营收!Claude Code负责人重磅访谈,首次分享更多细节内幕

Claude Code 在短短 5 个月内就实现了年化 4 亿美元的营收,成为史上增长最快的产品之一。更重要的是,它正在重新定义程序员与代码之间的关系。

来自主题: AI资讯
5446 点击    2025-08-10 15:46
4个月,创建20万个应用,这是背后的产品|对话百度秒哒

4个月,创建20万个应用,这是背后的产品|对话百度秒哒

4个月,创建20万个应用,这是背后的产品|对话百度秒哒

短短4个月,用户已经创建20万个应用,而且没有用一行代码! 这是百度无代码应用搭建平台 —— 秒哒的最新战绩。

来自主题: AI资讯
7342 点击    2025-08-09 16:30
一个半月高强度 Claude Code :Vibe coding 是一种全新的思维模式

一个半月高强度 Claude Code :Vibe coding 是一种全新的思维模式

一个半月高强度 Claude Code :Vibe coding 是一种全新的思维模式

如果你真的想进入深度的 vibe coding 状态,让 AI 发挥最大潜力,这种随时准备接管的心态反而会成为阻碍。人类开发者的干预时机和直接下场写代码的时候越少,最终呈现出的效率和效果反而越好。

来自主题: AI资讯
5671 点击    2025-08-09 16:08
编程/写作/PPT...GPT5深度实测(含场景提示语Prompt)

编程/写作/PPT...GPT5深度实测(含场景提示语Prompt)

编程/写作/PPT...GPT5深度实测(含场景提示语Prompt)

一起给GPT5上上强度吧! 我相信它的参数、API、纸面实力已经被扒得差不多了,所以接下来的内容先会分为总结篇,把system card、发布会、OpenAI自家技术博客、奥特曼私下说的信息做个全篇,然后从编程、写作、多模态、PPT等等给GPT犁一边,最后再总结一下GPT-5后续的一些开发计划啥的,Here we go!

来自主题: AI产品测评
6582 点击    2025-08-08 17:57