AI资讯新闻榜单内容搜索-o1-preview

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: o1-preview

上交大o1复现新突破：蒸馏超越原版，警示AI研发"捷径陷阱"

上交大o1复现新突破：蒸馏超越原版，警示AI研发"捷径陷阱"

上交大o1复现新突破：蒸馏超越原版，警示AI研发"捷径陷阱"

自从 OpenAI 发布展现出前所未有复杂推理能力的 o1 系列模型以来，全球掀起了一场 AI 能力 “复现” 竞赛。近日，上海交通大学 GAIR 研究团队在 o1 模型复现过程中取得新的突破，通过简单的知识蒸馏方法，团队成功使基础模型在数学推理能力上超越 o1-preview。

来自主题: AI技术研报

6734 点击 2024-11-22 16:46

媲美OpenAI事实性基准，这个中文评测集让o1-preview刚刚及格

媲美OpenAI事实性基准，这个中文评测集让o1-preview刚刚及格

媲美OpenAI事实性基准，这个中文评测集让o1-preview刚刚及格

如何解决模型生成幻觉一直是人工智能（AI）领域的一个悬而未解的问题。为了测量语言模型的事实正确性，近期 OpenAI 发布并开源了一个名为 SimpleQA 的评测集。而我们也同样一直在关注模型事实正确性这一领域，目前该领域存在数据过时、评测不准和覆盖不全等问题。例如现在大家广泛使用的知识评测集还是 CommonSenseQA、CMMLU 和 C-Eval 等选择题形式的评测集。

来自主题: AI技术研报

9293 点击 2024-11-20 15:02

杨植麟发布Kimi新模型：数学对标o1，中考高考考研成绩全第一

杨植麟发布Kimi新模型：数学对标o1，中考高考考研成绩全第一

杨植麟发布Kimi新模型：数学对标o1，中考高考考研成绩全第一

kimi全面开放一周年之际，创始人杨植麟亲自发布新模型—— 数学模型k0-math，对标OpenAI o1系列，主打深入思考。在MATH、中考、高考、考研4个数学基准测试中，k0-math成绩超过o1-mini和o1-preview。

来自主题: AI资讯

8430 点击 2024-11-16 21:16

李飞飞吴佳俊团队新作：推出具身智能决策能力评价基准，o1-preview登顶 | NeurIPS

李飞飞吴佳俊团队新作：推出具身智能决策能力评价基准，o1-preview登顶 | NeurIPS

李飞飞吴佳俊团队新作：推出具身智能决策能力评价基准，o1-preview登顶 | NeurIPS

大模型的具身智能决策能力，终于有系统的通用评估基准了。

来自主题: AI技术研报

8289 点击 2024-11-14 20:48

Windows版ChatGPT来了！直接用上最强o1，快捷键即可召唤

Windows版ChatGPT来了！直接用上最强o1，快捷键即可召唤

Windows版ChatGPT来了！直接用上最强o1，快捷键即可召唤

终于，Windows用户也可以用上ChatGPT了。就在刚刚，OpenAI推出了适用Windows系统的ChatGPT应用。不过，目前仅供ChatGPT Plus、Team、Enterprise和Edu用户使用。

来自主题: AI资讯

5358 点击 2024-10-18 13:27

o1规划能力首测！已超越语言模型范畴，preview终于赢mini一回

o1规划能力首测！已超越语言模型范畴，preview终于赢mini一回

o1规划能力首测！已超越语言模型范畴，preview终于赢mini一回

o1-preview终于赢过了mini一次！亚利桑那州立大学的最新研究表明，o1-preview在规划任务上，表现显著优于o1-mini。

来自主题: AI资讯

5167 点击 2024-09-29 15:47

谷歌Gemini数学反超o1预览版！成本仅1/10、无需额外思考时间，旧范式还没有死

谷歌Gemini数学反超o1预览版！成本仅1/10、无需额外思考时间，旧范式还没有死

谷歌Gemini数学反超o1预览版！成本仅1/10、无需额外思考时间，旧范式还没有死

数学击败o1-preview，成本仅为十分之一，并且几乎没有思考延迟！

来自主题: AI资讯

6127 点击 2024-09-26 11:41

北大AI奥数评测，o1-mini比o1-preview分数还高

北大AI奥数评测，o1-mini比o1-preview分数还高

北大AI奥数评测，o1-mini比o1-preview分数还高

OpenAI的o1系列一发布，传统数学评测基准都显得不够用了。

来自主题: AI技术研报

9280 点击 2024-09-23 15:30

抵挡AI的最后一个基准！CAIS发布50万美元悬赏令：汇集人类顶尖专家，专攻高难度问题

抵挡AI的最后一个基准！CAIS发布50万美元悬赏令：汇集人类顶尖专家，专攻高难度问题

抵挡AI的最后一个基准！CAIS发布50万美元悬赏令：汇集人类顶尖专家，专攻高难度问题

随着AI模型的水平不断提高，现有的基准测试也被逐一攻破。CAIS和Scale AI共同发起了属于人类的最后一搏，悬赏50万美元，把最高难度、只有最顶尖的人才能回答出的问题收集起来作为基准，是否能挡住AI模型的攻势？

来自主题: AI资讯

8551 点击 2024-09-23 15:12

Open o1不会“消灭”程序员

Open o1不会“消灭”程序员

Open o1不会“消灭”程序员

AI编程技术竞赛加剧

来自主题: AI资讯

7600 点击 2024-09-21 14:57

上一页当前第2页,共3页下一页