AI资讯新闻榜单内容搜索-o4

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: o4
Test Time Scaling Law远未达到上限! o4-mini仅15.8%通过率,华为诺亚提出代码HLCE终极基准

Test Time Scaling Law远未达到上限! o4-mini仅15.8%通过率,华为诺亚提出代码HLCE终极基准

Test Time Scaling Law远未达到上限! o4-mini仅15.8%通过率,华为诺亚提出代码HLCE终极基准

大语言模型(LLM)在标准编程基准测试(如 HumanEval,Livecodebench)上已经接近 “毕业”,但这是否意味着它们已经掌握了人类顶尖水平的复杂推理和编程能力?

来自主题: AI技术研报
6007 点击    2025-07-07 10:39
OAI/谷歌/DeepSeek首次合体「AI梦之队」!战力飙升30%,碾压一切单模型

OAI/谷歌/DeepSeek首次合体「AI梦之队」!战力飙升30%,碾压一切单模型

OAI/谷歌/DeepSeek首次合体「AI梦之队」!战力飙升30%,碾压一切单模型

三个前沿AI能融合成AGI吗?Sakana AI提出Multi-LLM AB-MCTS方法,整合o4-mini、Gemini-2.5-Pro与DeepSeek-R1-0528模型,在推理过程中动态协作,通过试错优化生成过程,有效融合群体AI智慧。

来自主题: AI技术研报
6955 点击    2025-07-06 13:06
OpenAI新模型,被曝秘密训练中!万字硬核长文直指o4核心秘密

OpenAI新模型,被曝秘密训练中!万字硬核长文直指o4核心秘密

OpenAI新模型,被曝秘密训练中!万字硬核长文直指o4核心秘密

SemiAnalysis全新硬核爆料,意外揭秘了OpenAI全新模型的秘密?据悉,新模型介于GPT-4.1和GPT-4.5之间,而下一代推理模型o4将基于GPT-4.1训练,而背后最大功臣,就是强化学习。

来自主题: AI技术研报
6329 点击    2025-06-11 12:20
全球30名顶尖数学家秘密集会围剿AI,当场破防!惊呼已接近数学天才

全球30名顶尖数学家秘密集会围剿AI,当场破防!惊呼已接近数学天才

全球30名顶尖数学家秘密集会围剿AI,当场破防!惊呼已接近数学天才

最近,30位世界顶尖数学家亲自出马,在UC伯克利对OpenAI o4-mini展开「围剿」,两天连出教授级难题,结果却当场集体「破防」!有人直言:这个AI,的确已接近数学天才的水平。曾经以为AGI遥遥无期,如今仿佛只剩临门一脚了……

来自主题: AI资讯
6361 点击    2025-06-08 11:25
函数调用提示词咋写,看下OpenAI发布的Function Calling指南(万字含示例)|最新

函数调用提示词咋写,看下OpenAI发布的Function Calling指南(万字含示例)|最新

函数调用提示词咋写,看下OpenAI发布的Function Calling指南(万字含示例)|最新

端午节前OpenAI发布了o3/o4-mini模型的Function Calling指南,这份指南可以说是目前网上最硬核权威的大模型函数调用实战手册,没有之一。

来自主题: AI技术研报
7143 点击    2025-06-03 12:19
刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了

刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了

刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了

新版DeepSeek-R1重磅开源,凌晨已放出权重!此次模型性能几乎与o4-mini(Medium)相当,编程实测超越Claude 4 Sonnet。网友纷纷惊叹:开源又一次胜利了。

来自主题: AI资讯
5940 点击    2025-05-29 11:44
40位数学家组成8队与o4-mini-medium比赛,6队败北

40位数学家组成8队与o4-mini-medium比赛,6队败北

40位数学家组成8队与o4-mini-medium比赛,6队败北

最近,AI 在数学和编程上的能力飞跃令人瞠目结舌 —— 在不少任务上,它已经悄然超越了我们大多数人类。而当它面对真正的专家,会发生什么?

来自主题: AI资讯
6998 点击    2025-05-25 16:13
陶哲轩携AI再战数学!o4-mini秒怂弃赛,Claude 20分钟通关

陶哲轩携AI再战数学!o4-mini秒怂弃赛,Claude 20分钟通关

陶哲轩携AI再战数学!o4-mini秒怂弃赛,Claude 20分钟通关

陶哲轩YouTube视频第二弹震撼来袭!这一次,他让AI挑战在Lean中形式化代数蕴含证明,结果Claude约20分通关,o4-mini太过谨慎直接「弃赛」。

来自主题: AI资讯
5897 点击    2025-05-15 12:08