全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压
全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压最顶尖的AI模型,做起奥数题来已经和人类相当,那做物理题水平如何呢?港大等机构的研究发现:即使GPT-4o、Claude 3.7 Sonnet这样的最强模型,做物理题也翻车了,准确率直接被人类专家碾压!
搜索
最顶尖的AI模型,做起奥数题来已经和人类相当,那做物理题水平如何呢?港大等机构的研究发现:即使GPT-4o、Claude 3.7 Sonnet这样的最强模型,做物理题也翻车了,准确率直接被人类专家碾压!
我们采用了AI暴露度指标构建的方法,随机抽取了2018年1月到2024年5月的125万条招聘大数据进行分析,并最终计算出每个职业的AI大语言模型暴露度。
上个月写了篇Dia的推荐文章,有9千的阅读,一个多月过去后,黄叔经常有:“又是爱上Dia的一天”的感觉,并且,Dia已经成为了我的Mac Mini+MacBookAir两台电脑上的默认浏览器。
在产品不断被「AI 化」的浪潮中,连浏览器也无法幸免。
从「造模型」到「用好模型」,腾讯想做 AI 落地的那双手
借助AI的“智能体检”会是什么样子?
前几天在论坛上看别人激烈辩论 AI 是否会取代工程师,突然有人在回复中冷不丁的抛出一个评论: 别说那么多废话,先让 AI 画个左撇子出来。 这是个什么问题?
人工智能的2C应用进展很快,2024年美国居民生成式AI的渗透率已达39.6%(来源:圣路易斯联储)。然而,当前的模型厂商还热衷于评分打榜、技术炫耀,企业应用尚处于早期阶段。迫切需要找到丰富的落地场景,加快推进AI和各行各业的深度融合。
本篇内容是「AGIX 投什么」系列的第 7 篇。AGIX 指数 从全球上千家科技上市公司中精选出的 40 家左右最能把握 AGI 价值整理的公司,AGIX 指数组合即是定位 AGI 进程的坐标,也能够为投资者捕捉 AI-alpha 提供价值工具。在「AGIX 投什么」板块,我们会对 AGIX Index 的组合公司进行深度分析,输出全面的 AI 投资参考。
天才的标签之外杨植麟还是个资深文青。90后一代或多或少都曾迷恋过村上春树,1992年出生的杨植麟也不例外。在村上春树的一本小说中,杨植麟对一个程序员深夜写代码这件事印象深刻,并充满憧憬,这为他未来进入AI领域埋下伏笔。