OpenAI的「看图思考」被玩坏了!我把工位照片给 o3 ,隐藏属性都被扒出来……
OpenAI的「看图思考」被玩坏了!我把工位照片给 o3 ,隐藏属性都被扒出来……知道大模型接下来要卷视觉推理,但没想到这么卷——数学试卷都快要不够用了。
来自主题: AI资讯
6821 点击 2025-04-18 16:08
搜索
知道大模型接下来要卷视觉推理,但没想到这么卷——数学试卷都快要不够用了。
公考行测中的逻辑推理题,是不少考生的噩梦,这次,CMU团队就此为基础,打造了一套逻辑谜题挑战。实测后发现,o1、Gemini-2.5 Pro、Claude-3.7-Sonnet这些顶尖大模型全部惨败!最强的AI正确率也只有57.5%,而人类TOP选手却能接近满分。
对于AI视觉多模态大模型只关注显著信息这一根本性缺陷,哈工大GiVE实现突破!
Llama 4 或许只是冰山一角。
作为玩家基数庞大的60级显卡新品,RTX 5060 Ti带来了显著的性能飞跃。得益于强大的DLSS 4多帧生成黑科技,它不仅能在合理设置下以4K运行大型3A游戏,而且还能轻松跑通本地AI大模型。
AI趋势正在“中场休息”,在此之前训练>评估,在此之后评估>训练。
多模态生成技术持续突破内容创作的边界。
“DeepSeek,评价一下第三届中国AIGC产业峰会”:
2025,当大模型来到应用爆发之年,越来越多的垂直行业当中,开始涌现出AI落地的经典实践案例。
从人们被大模型“震撼”完开始思考如何把这项技术用起来的第一天,教育就是被很多人天然想到的场景。一个能压缩全世界知识的AI,天然就是一个人类想象里“老师”的样子。