AI资讯新闻榜单内容搜索-GPT-4o

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: GPT-4o

沃顿商学院已发布4篇「Prompt」报告｜重磅

沃顿商学院已发布4篇「Prompt」报告｜重磅

沃顿商学院已发布4篇「Prompt」报告｜重磅

宾夕法尼亚大学沃顿商学院（The Wharton School）今年发布了一系列名为《Prompting Science Reports》的重磅研究报告。他们选取了2024-2025最常用的模型（如GPT-4o, Claude 3.5 Sonnet, Gemini Pro/Flash等），在极高难度的博士级基准测试（GPQA Diamond）上进行了数万次的严谨测试。

来自主题: AI技术研报

7858 点击 2025-12-10 16:11

OpenAI大溃败！GPT-5「换皮」GPT-4o，两年半预训练0突破

OpenAI大溃败！GPT-5「换皮」GPT-4o，两年半预训练0突破

OpenAI大溃败！GPT-5「换皮」GPT-4o，两年半预训练0突破

OpenAI，亟需一场翻身仗！今天，全网最大的爆料：GPT-5基石实为GPT-4o。自4o发布之后，内部预训练屡屡受挫，几乎沦为「弃子」。

来自主题: AI资讯

7039 点击 2025-12-01 10:03

中兴发了一篇论文，洞察AI更前沿的探索方向

中兴发了一篇论文，洞察AI更前沿的探索方向

中兴发了一篇论文，洞察AI更前沿的探索方向

当大模型参数量冲向万亿级，GPT-4o、Llama4 等模型不断刷新性能上限时，AI 行业也正面临前所未有的瓶颈。Transformer 架构效率低、算力消耗惊人、与物理世界脱节等问题日益凸显，通用人工智能（AGI）的实现路径亟待突破。

来自主题: AI技术研报

7034 点击 2025-11-26 13:47

GPT-4o准确率仅为24%！权威中文教育基准：知识+情商的双重考验

GPT-4o准确率仅为24%！权威中文教育基准：知识+情商的双重考验

GPT-4o准确率仅为24%！权威中文教育基准：知识+情商的双重考验

华东师范大学智能教育学院发布OmniEduBench，首次从「知识+育人」双维度评测大模型教育能力。测评2.4万道中文题后，实验结果显示：GPT-4o等顶尖AI会做题，却在启发思维、情感支持等育人能力上远不及人类，暴露AI当老师的关键短板。

来自主题: AI技术研报

7036 点击 2025-11-15 10:15

北大字节开源首个时空推理视频模型！思考过程全透明，性能超越GPT-4o

北大字节开源首个时空推理视频模型！思考过程全透明，性能超越GPT-4o

北大字节开源首个时空推理视频模型！思考过程全透明，性能超越GPT-4o

AI看视频也能划重点了！

来自主题: AI技术研报

10627 点击 2025-11-06 09:40

开发者生产力“平替”？MiniMax M2全面测评：代码、速度与迁移成本

开发者生产力“平替”？MiniMax M2全面测评：代码、速度与迁移成本

开发者生产力“平替”？MiniMax M2全面测评：代码、速度与迁移成本

生成式AI技术的成熟，让智能编程逐渐成为众多开发者的日常，然而一个大模型API选型的“不可能三角”又随之而来：追求顶级、高速的智能（如GPT-4o/Claude 3.5），就必须接受高昂的调用成本；追求低成本，又往往要在性能和稳定性上做出妥协。开发者“既要又要”的正义，谁能给？

来自主题: AI产品测评

9726 点击 2025-11-05 10:25

斯坦福7B智能体全面超越GPT-4o，推理流登顶HF

斯坦福7B智能体全面超越GPT-4o，推理流登顶HF

斯坦福7B智能体全面超越GPT-4o，推理流登顶HF

传统智能体系统难以兼顾稳定性和学习能力，斯坦福等学者提出AgentFlow框架，通过模块化和实时强化学习，在推理中持续优化策略，并使小规模模型在多项任务中超越GPT-4o，为AI发展开辟新思路。

来自主题: AI技术研报

7836 点击 2025-11-04 10:43

OpenAI公开未来路线图！具体到28年3月AI研究员将完全自主，奥特曼承认“关于GPT-4o我们搞砸了”

OpenAI公开未来路线图！具体到28年3月AI研究员将完全自主，奥特曼承认“关于GPT-4o我们搞砸了”

OpenAI公开未来路线图！具体到28年3月AI研究员将完全自主，奥特曼承认“关于GPT-4o我们搞砸了”

OpenAI完成史上最重要的一次组织架构调整后，紧接着开了一场直播。首次公开了内部研究目标的具体时间表，其中最引人注目的是“在2028年3月实现完全自主的AI研究员”，具体到月份。

来自主题: AI资讯

7504 点击 2025-10-29 12:04

Seedream 4.0大战Nano Banana、GPT-4o？EdiVal-Agent 终结图像编辑评测

Seedream 4.0大战Nano Banana、GPT-4o？EdiVal-Agent 终结图像编辑评测

Seedream 4.0大战Nano Banana、GPT-4o？EdiVal-Agent 终结图像编辑评测

在 AIGC 的下一个阶段，图像编辑（Image Editing）正逐渐取代一次性生成，成为检验多模态模型理解、生成与推理能力的关键场景。我们该如何科学、公正地评测这些图像编辑模型？

来自主题: AI技术研报

6728 点击 2025-10-25 14:26

AI在线强化学习“边做边学”，斯坦福团队让7B小模型性能飙升，甚至超越GPT-4o

AI在线强化学习“边做边学”，斯坦福团队让7B小模型性能飙升，甚至超越GPT-4o

AI在线强化学习“边做边学”，斯坦福团队让7B小模型性能飙升，甚至超越GPT-4o

斯坦福等新框架，用在线强化学习让智能体系统“以小搏大”，领先GPT-4o—— AgentFlow，是一种能够在线优化智能体系统的新范式，可以持续提升智能体系统对于复杂问题的推理能力。

来自主题: AI技术研报

5960 点击 2025-10-25 14:03

上一页当前第1页,共43页下一页