AI资讯新闻榜单内容搜索-AI视觉

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI视觉
20岁斯坦福辍学生2天搞定500万美元融资:AI直接"偷窥"用户屏幕,重新定义产品分析

20岁斯坦福辍学生2天搞定500万美元融资:AI直接"偷窥"用户屏幕,重新定义产品分析

20岁斯坦福辍学生2天搞定500万美元融资:AI直接"偷窥"用户屏幕,重新定义产品分析

当我了解到一群平均年龄只有21岁的年轻创业者,在短短几天内就从Y Combinator、General Catalyst等顶级投资机构手中拿到500万美元融资时,我意识到他们可能找到了一个真正的痛点。这家叫Human Behavior的公司,正试图用AI彻底改变企业理解用户行为的方式。他们的方法听起来简单得令人怀疑:让AI直接"观看"用户使用产品的录像,然后自动分析出用户的真实意图和行为模式。

来自主题: AI资讯
6335 点击    2025-09-09 17:59
2025年了,AI还看不懂时钟!90%人都能答对,顶尖AI全军覆没

2025年了,AI还看不懂时钟!90%人都能答对,顶尖AI全军覆没

2025年了,AI还看不懂时钟!90%人都能答对,顶尖AI全军覆没

一般人准确率89.1%,AI最好只有13.3%。在新视觉基准ClockBench上,读模拟时钟这道「小学题」,把11个大模型难住了。为什么AI还是读不准表?是测试有问题还是AI真不行?

来自主题: AI资讯
5536 点击    2025-09-09 17:24
主观评测五大AI助手识图能力,奇葩卫生间标识识别大PK

主观评测五大AI助手识图能力,奇葩卫生间标识识别大PK

主观评测五大AI助手识图能力,奇葩卫生间标识识别大PK

作者测试了智谱GLM-4.5V(开启/关闭推理)、豆包、Kimi、元宝和ChatGPT-5在识别十张奇葩卫生间标识上的表现。评测模拟紧急如厕场景,按识别正确性评分。结果智谱普通模式得分最高(86分),ChatGPT-5和智谱推理模式次之(78分),豆包和元宝70分,Kimi垫底(38分),揭示了各AI视觉能力的差异及局限性。

来自主题: AI产品测评
6204 点击    2025-08-18 10:44
豆包悄悄上线的这个新功能,也能用眼睛推理全世界了。

豆包悄悄上线的这个新功能,也能用眼睛推理全世界了。

豆包悄悄上线的这个新功能,也能用眼睛推理全世界了。

上周我写过一篇AI产品自用分享,当时我说,AI知识问答方面,我会选择openai o3和豆包。

来自主题: AI资讯
7721 点击    2025-08-07 11:39
告别评估乱象!首个视觉解释综合性基准发布,附人类真值 | KDD'25

告别评估乱象!首个视觉解释综合性基准发布,附人类真值 | KDD'25

告别评估乱象!首个视觉解释综合性基准发布,附人类真值 | KDD'25

埃默里大学团队推出首个覆盖8个真实任务、带有人类解释真值的视觉解释基准Saliency-Bench,统一评估流程与开源工具让显著性方法可公平比较,获KDD’25接收,为可解释AI奠定透明、可靠的基石。

来自主题: AI技术研报
7627 点击    2025-07-21 15:59
完全免费开放,美图上线AI视觉Agent

完全免费开放,美图上线AI视觉Agent

完全免费开放,美图上线AI视觉Agent

本来以为美图可能会在 8 月份推出新产品,给中期财报壮声势,但没想到,公告发布 20 天不到,这款名为 RoboNeo 的 AI Agent 就上线了,而且是直接面向所有用户免费开放。

来自主题: AI资讯
8203 点击    2025-07-14 22:16
AI们数不清六根手指,这事没那么简单。

AI们数不清六根手指,这事没那么简单。

AI们数不清六根手指,这事没那么简单。

昨天Grok4发布完以后,我随手刷了一下X。

来自主题: AI资讯
8075 点击    2025-07-14 11:27
以人文本的 AI 品牌设计

以人文本的 AI 品牌设计

以人文本的 AI 品牌设计

传统科技公司、尤其是 2B 的公司,其信息、视觉传达都是以公司、产品、技术创新为中心的。但是,处在现代最前沿技术之一的 AI 公司,似乎想做一些不一样的传达。我们将近距离看一下 OpenAI,Cohere,Anthropic 这三家 AI 模型公司的信息、视觉传达,看看他们怎么是从传统科技公司的风格中,做出一些不一样的、以人为本的品牌设计的。

来自主题: AI资讯
7341 点击    2025-04-15 22:09