AI资讯新闻榜单内容搜索-EVI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: EVI
北大AI奥数评测,o1-mini比o1-preview分数还高

北大AI奥数评测,o1-mini比o1-preview分数还高

北大AI奥数评测,o1-mini比o1-preview分数还高

OpenAI的o1系列一发布,传统数学评测基准都显得不够用了。

来自主题: AI技术研报
7700 点击    2024-09-23 15:30
抵挡AI的最后一个基准!CAIS发布50万美元悬赏令:汇集人类顶尖专家,专攻高难度问题

抵挡AI的最后一个基准!CAIS发布50万美元悬赏令:汇集人类顶尖专家,专攻高难度问题

抵挡AI的最后一个基准!CAIS发布50万美元悬赏令:汇集人类顶尖专家,专攻高难度问题

随着AI模型的水平不断提高,现有的基准测试也被逐一攻破。CAIS和Scale AI共同发起了属于人类的最后一搏,悬赏50万美元,把最高难度、只有最顶尖的人才能回答出的问题收集起来作为基准,是否能挡住AI模型的攻势?

来自主题: AI资讯
7346 点击    2024-09-23 15:12
Open o1不会“消灭”程序员

Open o1不会“消灭”程序员

Open o1不会“消灭”程序员

AI编程技术竞赛加剧

来自主题: AI资讯
6371 点击    2024-09-21 14:57
留子们用火星文写避雷帖,AI竟看懂了?我们实测:几乎全军覆没

留子们用火星文写避雷帖,AI竟看懂了?我们实测:几乎全军覆没

留子们用火星文写避雷帖,AI竟看懂了?我们实测:几乎全军覆没

留子们在写一种很新的差评。 由于全球点评打卡平台,都有个自动翻译的功能,为了防止被店家骚扰,也为了给同胞避雷,身在海外的国人们,想出各种奇招优雅给差评。

来自主题: AI资讯
3521 点击    2024-09-20 10:06
OpenAI o1全方位SOTA登顶lmsys排行榜!数学能力碾压Claude和谷歌模型,o1-mini并列第一

OpenAI o1全方位SOTA登顶lmsys排行榜!数学能力碾压Claude和谷歌模型,o1-mini并列第一

OpenAI o1全方位SOTA登顶lmsys排行榜!数学能力碾压Claude和谷歌模型,o1-mini并列第一

o1模型发布1周,lmsys的6k+投票就将o1-preview送上了排行榜榜首。同时,为了满足大家对模型「IOI金牌水平」的好奇心,OpenAI放出了o1测评时提交的所有代码。

来自主题: AI资讯
8655 点击    2024-09-19 22:03
昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍

昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍

昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍

前些天,OpenAI 发布了 ο1 系列模型,它那「超越博士水平的」强大推理性能预示着其必将在人们的生产生活中大有作为。但它的使用成本也很高,以至于 OpenAI 不得不限制每位用户的使用量:每位用户每周仅能给 o1-preview 发送 30 条消息,给 o1-mini 发送 50 条消息。

来自主题: AI技术研报
5058 点击    2024-09-17 19:14
深挖 OpenAI o1 :独立思考,智商超群,思维隐藏,一石三鸟...

深挖 OpenAI o1 :独立思考,智商超群,思维隐藏,一石三鸟...

深挖 OpenAI o1 :独立思考,智商超群,思维隐藏,一石三鸟...

全网 OpenAI o1 的测试基本跑完,大家基本认可这是一个独立思考智商超高的模型,智商测试120,高考数学全对。

来自主题: AI资讯
8574 点击    2024-09-16 20:08
榨取大模型算力,百度想了一些招

榨取大模型算力,百度想了一些招

榨取大模型算力,百度想了一些招

以前最宝贵的资源是黄金,现在最宝贵的资源是算力。

来自主题: AI资讯
8448 点击    2024-09-16 20:01
Meta:大语言模型可以通过自我批判取得大幅提升!

Meta:大语言模型可以通过自我批判取得大幅提升!

Meta:大语言模型可以通过自我批判取得大幅提升!

论文的审稿模式想必大家都不会陌生,一篇论文除了分配多个评审,最后还将由PC综合评估各位审稿人的reviews撰写meta-review。

来自主题: AI技术研报
7352 点击    2024-09-04 23:07