
速递|斯坦福90后中国数学博士的AI公司,未出产品先融资5000万美元,B Capital正洽谈领投
速递|斯坦福90后中国数学博士的AI公司,未出产品先融资5000万美元,B Capital正洽谈领投数学家们一直痴迷于能够解决复杂数学问题的人工智能。OpenAI 等机构开发这些模型的部分开发者认为,学会解决数学难题的 AI 可以运用相似的推理方法来解决其他类型的问题。但由于当前的人工智能尚未证明能在高等数学领域超越人类专家,一些创业者看到了开发专业数学模型的机遇。
数学家们一直痴迷于能够解决复杂数学问题的人工智能。OpenAI 等机构开发这些模型的部分开发者认为,学会解决数学难题的 AI 可以运用相似的推理方法来解决其他类型的问题。但由于当前的人工智能尚未证明能在高等数学领域超越人类专家,一些创业者看到了开发专业数学模型的机遇。
DeepSeek放大招!新模型专注数学定理证明,大幅刷新多项高难基准测试。在普特南测试上,新模型DeepSeek-Prover-V2直接把记录刷新到49道。目前的第一名在657道题中只做出10道题,为Kimi与AIME2024冠军团队Numina合作成果Kimina-Prover。
都说国产大模型“通义千问”能打,到底是真强还是智商税?今天就带你看看,这个国产“AI猛将”凭什么火出圈! 2023年4月,阿里巴巴推出通义千问,选择了“全开源”的策略,成为全球开发者关注的焦点。而在2024年的云栖大会上,阿里云进一步发布了Qwen2.5系列,包括多个尺寸的大语言模型、多模态模型、数学模型和代码模型,涵盖从0.5B到72B的完整规模
11月16日,陷入前投资人仲裁风波的主角杨植麟突然出现,并对外发布了一款数学模型。 杨植麟将自己的数学模型k0-math对标OpenAI o1系列,主打深入思考。
kimi全面开放一周年之际,创始人杨植麟亲自发布新模型—— 数学模型k0-math,对标OpenAI o1系列,主打深入思考。 在MATH、中考、高考、考研4个数学基准测试中,k0-math成绩超过o1-mini和o1-preview。
就在刚刚,谷歌DeepMind最新的数学模型捧得了IMO奥数银牌!它不仅以满分成绩做出了6道题中的4道,距离金牌只有1分之差,而且在第4题上只用了19秒,解题质量和速度惊呆了评分的人类评委。
这几日,AI 圈又一“震惊”事件!!
I/O大会上,谷歌Gemini 1.5 Pro一系列更新让开发者们再次沸腾。最新技术报告中,最引人注目的一点是,数学专业版1.5 Pro性能碾压GPT-4 Turbo、Claude 3 Opus,成为全球最强的数学模型。
7B开源模型,数学能力超过了千亿规模的GPT-4!它的表现可谓是突破了开源模型的极限,连阿里通义的研究员也感叹缩放定律是不是失效了。
今天,谷歌DeepMind的AlphaGeometry模型登上了Nature!30道IMO几何题中,它能做出25道,已经接近人类金牌选手的水平!而GPT-4,却一道题都没做出来,直接挂了零蛋。