OpenAI的「看图思考」被玩坏了!我把工位照片给 o3 ,隐藏属性都被扒出来……
OpenAI的「看图思考」被玩坏了!我把工位照片给 o3 ,隐藏属性都被扒出来……知道大模型接下来要卷视觉推理,但没想到这么卷——数学试卷都快要不够用了。
搜索
知道大模型接下来要卷视觉推理,但没想到这么卷——数学试卷都快要不够用了。
消费级AI机器人公司「X-ORIGIN-AI」(玄源科技)宣布完成近亿元Pre-A轮融资,本轮由东方富海领投,金鼎资本与联想之星跟投,仁辰资本担任财务顾问。本轮融资距离X-ORIGIN-AI的天使轮融资仅有不到一季度时间,此前的数千万元天使轮由阿尔法公社领投,多名产业投资人跟投。
公考行测中的逻辑推理题,是不少考生的噩梦,这次,CMU团队就此为基础,打造了一套逻辑谜题挑战。实测后发现,o1、Gemini-2.5 Pro、Claude-3.7-Sonnet这些顶尖大模型全部惨败!最强的AI正确率也只有57.5%,而人类TOP选手却能接近满分。
想必各位开发者、产品经理或一些有想法的非程序员人士,已经使用了 Cursor 来协助完成一些开发任务,但是由于额度和有效期的问题,每次刚学会几招 Cursor 的使用方式,就用不了了。
据知情人士透露,过去一年中,Meta Platforms 曾请求微软、亚马逊等公司协助承担其旗舰大语言模型 Llama 的训练成本。该想法反映出对 AI 开发成本激增日益加剧的担忧,企业对资助开源软件犹豫不决。
替代中医的不是AI,而是会用AI的中医。
作为玩家基数庞大的60级显卡新品,RTX 5060 Ti带来了显著的性能飞跃。得益于强大的DLSS 4多帧生成黑科技,它不仅能在合理设置下以4K运行大型3A游戏,而且还能轻松跑通本地AI大模型。
视频理解的CoT推理能力,怎么评?
让推理模型不要思考,得到的结果反而更准确?
2025,当大模型来到应用爆发之年,越来越多的垂直行业当中,开始涌现出AI落地的经典实践案例。