AI资讯新闻榜单内容搜索-o1-preview

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: o1-preview
上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"

上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"

上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"

自从 OpenAI 发布展现出前所未有复杂推理能力的 o1 系列模型以来,全球掀起了一场 AI 能力 “复现” 竞赛。近日,上海交通大学 GAIR 研究团队在 o1 模型复现过程中取得新的突破,通过简单的知识蒸馏方法,团队成功使基础模型在数学推理能力上超越 o1-preview。

来自主题: AI技术研报
5060 点击    2024-11-22 16:46
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格

媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格

媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格

如何解决模型生成幻觉一直是人工智能(AI)领域的一个悬而未解的问题。为了测量语言模型的事实正确性,近期 OpenAI 发布并开源了一个名为 SimpleQA 的评测集。而我们也同样一直在关注模型事实正确性这一领域,目前该领域存在数据过时、评测不准和覆盖不全等问题。例如现在大家广泛使用的知识评测集还是 CommonSenseQA、CMMLU 和 C-Eval 等选择题形式的评测集。

来自主题: AI技术研报
7348 点击    2024-11-20 15:02
杨植麟发布Kimi新模型:数学对标o1,中考高考考研成绩全第一

杨植麟发布Kimi新模型:数学对标o1,中考高考考研成绩全第一

杨植麟发布Kimi新模型:数学对标o1,中考高考考研成绩全第一

kimi全面开放一周年之际,创始人杨植麟亲自发布新模型—— 数学模型k0-math,对标OpenAI o1系列,主打深入思考。 在MATH、中考、高考、考研4个数学基准测试中,k0-math成绩超过o1-mini和o1-preview。

来自主题: AI资讯
6857 点击    2024-11-16 21:16
Windows版ChatGPT来了!直接用上最强o1,快捷键即可召唤

Windows版ChatGPT来了!直接用上最强o1,快捷键即可召唤

Windows版ChatGPT来了!直接用上最强o1,快捷键即可召唤

终于,Windows用户也可以用上ChatGPT了。就在刚刚,OpenAI推出了适用Windows系统的ChatGPT应用。不过,目前仅供ChatGPT Plus、Team、Enterprise和Edu用户使用。

来自主题: AI资讯
3973 点击    2024-10-18 13:27
o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回

o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回

o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回

o1-preview终于赢过了mini一次! 亚利桑那州立大学的最新研究表明,o1-preview在规划任务上,表现显著优于o1-mini。

来自主题: AI资讯
3866 点击    2024-09-29 15:47
北大AI奥数评测,o1-mini比o1-preview分数还高

北大AI奥数评测,o1-mini比o1-preview分数还高

北大AI奥数评测,o1-mini比o1-preview分数还高

OpenAI的o1系列一发布,传统数学评测基准都显得不够用了。

来自主题: AI技术研报
7551 点击    2024-09-23 15:30
抵挡AI的最后一个基准!CAIS发布50万美元悬赏令:汇集人类顶尖专家,专攻高难度问题

抵挡AI的最后一个基准!CAIS发布50万美元悬赏令:汇集人类顶尖专家,专攻高难度问题

抵挡AI的最后一个基准!CAIS发布50万美元悬赏令:汇集人类顶尖专家,专攻高难度问题

随着AI模型的水平不断提高,现有的基准测试也被逐一攻破。CAIS和Scale AI共同发起了属于人类的最后一搏,悬赏50万美元,把最高难度、只有最顶尖的人才能回答出的问题收集起来作为基准,是否能挡住AI模型的攻势?

来自主题: AI资讯
7210 点击    2024-09-23 15:12
Open o1不会“消灭”程序员

Open o1不会“消灭”程序员

Open o1不会“消灭”程序员

AI编程技术竞赛加剧

来自主题: AI资讯
6253 点击    2024-09-21 14:57