
高考数学斩获139分!小米7B模型比肩Qwen3-235B、OpenAI o3
高考数学斩获139分!小米7B模型比肩Qwen3-235B、OpenAI o3上上周的 2025 高考已经落下了帷幕!在人工智能领域,各家大模型向数学卷发起了挑战。
上上周的 2025 高考已经落下了帷幕!在人工智能领域,各家大模型向数学卷发起了挑战。
谷歌DeepMind重磅出击,开源首个形式化数学猜想库,获陶哲轩力挺!从解析数论的兰道猜想开始,这个开源项目将为AI破解数学难题的未来铺路。
本文将介绍 DeepMath-103K 数据集。该工作由腾讯 AI Lab 与上海交通大学团队共同完成。
最近,30位世界顶尖数学家亲自出马,在UC伯克利对OpenAI o4-mini展开「围剿」,两天连出教授级难题,结果却当场集体「破防」!有人直言:这个AI,的确已接近数学天才的水平。曾经以为AGI遥遥无期,如今仿佛只剩临门一脚了……
数学家出手反击AI!对AlphaEvolve在“集合和差问题”上的成果进一步改进。
AI数学家来了!清华团队出品—— 他们推出AI Mathematician(AIM)框架,推理模型也能求解前沿理论研究,并且证明完成度很高。
数学家们一直痴迷于能够解决复杂数学问题的人工智能。OpenAI 等机构开发这些模型的部分开发者认为,学会解决数学难题的 AI 可以运用相似的推理方法来解决其他类型的问题。但由于当前的人工智能尚未证明能在高等数学领域超越人类专家,一些创业者看到了开发专业数学模型的机遇。
数据枯竭正成为AI发展的新瓶颈!CMU团队提出革命性方案SRT:让LLM实现无需人类标注的自我进化!SRT初期就能迭代提升数学与推理能力,甚至性能逼近传统强化学习的效果,揭示了其颠覆性潜力。
人类数学家与AlphaEvolve携手,一周内两次刷新18年未破的数学纪录!展现AI与人类协作的惊人潜力。AI如侦察兵广度扫描,人类专家深度优化,双引擎驱动下,科学前沿正在加速推进!
陶哲轩转发,AI搞数学证明的标准习题集来了!