AI产品测评-这里有最详细的人工智能工具测评解析

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了

腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了

腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了

近日,腾讯开始内测一款名为Marvis(马维斯)的操作系统层个人AI助手。这一AI助手通过多个Agent的协作完成App操作、EXE操作、电脑操作、文件管理、文档生成以及各种复杂任务,24小时持续在线,并支持跨端操作。

来自主题: AI产品测评
9457 点击    2026-05-16 11:08
一手实测:MiniMax 全新发布 Mavis,是什么?

一手实测:MiniMax 全新发布 Mavis,是什么?

一手实测:MiniMax 全新发布 Mavis,是什么?

把 Agent 从单体,组成一支可以协作的 Agent Teams。

来自主题: AI产品测评
10035 点击    2026-05-14 14:27
实测 Alice:人人都能免费使用的活人感 Agent

实测 Alice:人人都能免费使用的活人感 Agent

实测 Alice:人人都能免费使用的活人感 Agent

我看到洛小山做的 Alice,在「观猹」上取得了高分 8.2 的成绩。这是一个免费的 AI 个人助理(接入词元跳动注册即送免费算力):她有完整的人设,26 岁澳门女生,会在凌晨提醒你早睡,还会私下「小声蛐蛐」对你的观察。

来自主题: AI产品测评
8053 点击    2026-05-10 22:14
千元横测GPT、DeepSeek、Xiaomi、MiniMax的最强模型,我找到了跟Agent们的绝配

千元横测GPT、DeepSeek、Xiaomi、MiniMax的最强模型,我找到了跟Agent们的绝配

千元横测GPT、DeepSeek、Xiaomi、MiniMax的最强模型,我找到了跟Agent们的绝配

上周太集中发的后果就是光在用GPT -5.5了,小米的Mimo-V2.5-Pro,DeepSeek V4 Pro还没有放在Agent的场景上测。所以我跟钱包一拍即合,复制了4个一模一样的Hermes Agent,记忆一样,skill一样,系统设置一样,能调用的工具也一样。

来自主题: AI产品测评
10337 点击    2026-05-03 08:49
国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马

国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马

国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马

从去年开始做这个账号以来,我其实写过不少测模型的文章。我相信也有很多朋友是因为看了我测评的文章关注我的。但从过年之后,真的就很少写模型评测的文章了。主要是我写文章的速度甚至一度跟不上模型发布的速度了。

来自主题: AI产品测评
9718 点击    2026-05-02 11:01
实测千问新出的PPT Agent,可算不用为了风格化牺牲二次编辑了。

实测千问新出的PPT Agent,可算不用为了风格化牺牲二次编辑了。

实测千问新出的PPT Agent,可算不用为了风格化牺牲二次编辑了。

这段时间做了巨多PPT。 多到我现在都条件反射了,好不好看先放一边,先看AI容易错的细节。 文字有没有糊,布局是不是在装高级,图片是不是只是看起来有氛围感,该有的信息都没放进去, 再就是画面上有没有一

来自主题: AI产品测评
9600 点击    2026-05-01 10:51
开源版的 GPT Image 2,信息图、连续图文、本地部署全拿下|商汤SenseNova U1实测

开源版的 GPT Image 2,信息图、连续图文、本地部署全拿下|商汤SenseNova U1实测

开源版的 GPT Image 2,信息图、连续图文、本地部署全拿下|商汤SenseNova U1实测

SenseNova U1 是商汤最新发布的一个开源的多模态模型,它的 Lite 系列 8B 和 A3B 参数版本,目前已经在 Hugging Face 和 GitHub 上开源。APPSO 也提前拿到了测试资格,我们发现商汤这款新一代原生理解生成统一模型,就开源模型来说,已经做到了最好水平。

来自主题: AI产品测评
9224 点击    2026-04-29 19:51
小米双模型正式开源!MiMo-V2.5-Pro无中断肝出“macOS”:54个应用全开、浏览器真能冲浪

小米双模型正式开源!MiMo-V2.5-Pro无中断肝出“macOS”:54个应用全开、浏览器真能冲浪

小米双模型正式开源!MiMo-V2.5-Pro无中断肝出“macOS”:54个应用全开、浏览器真能冲浪

没错,用的就是主打长程任务、模糊指令遵循,跻身国产Agent第一梯队的小米MiMo‑V2.5 Pro。小米最新发布的MiMo‑V2.5系列,包含Pro旗舰Agent、全模态基座、TTS语音合成、ASR语音识别四大模型,综合实力对标国际顶尖水准。

来自主题: AI产品测评
6726 点击    2026-04-29 10:04
DeepSeek-V4和GPT-5.5第一波实测对决,结果出人意料!

DeepSeek-V4和GPT-5.5第一波实测对决,结果出人意料!

DeepSeek-V4和GPT-5.5第一波实测对决,结果出人意料!

昨夜,GPT-5.5果然按期发布了,全网没有白等。更炸裂的是,就在同一天,DeepSeek-V4紧随其后发布了!实测后,结果出人意料。

来自主题: AI产品测评
7820 点击    2026-04-25 09:56
实测ChatGPT最新生图模型三大发现

实测ChatGPT最新生图模型三大发现

实测ChatGPT最新生图模型三大发现

AI第一次从包工头,变成了建筑设计师。

来自主题: AI产品测评
6583 点击    2026-04-24 10:09
做自媒体的朋友,请一定认识一下这只叫Ribbi的青蛙。

做自媒体的朋友,请一定认识一下这只叫Ribbi的青蛙。

做自媒体的朋友,请一定认识一下这只叫Ribbi的青蛙。

上次 Ribbi 刚开始内测的时候,好友 Joanna 就给了我邀请,东忙西忙没来得及体验,这两天玩上了,也是感受到了这个小青蛙的魅力了。

来自主题: AI产品测评
7634 点击    2026-04-23 10:06
实测OpenRouter黑马模型,批量任务秒级响应,成本只有GPT-5.4-mini的1/10

实测OpenRouter黑马模型,批量任务秒级响应,成本只有GPT-5.4-mini的1/10

实测OpenRouter黑马模型,批量任务秒级响应,成本只有GPT-5.4-mini的1/10

用AI跑批量任务的人,手里基本都有一个干活的模型,不是最聪明,但要快、要便宜,稳定不出岔子。

来自主题: AI产品测评
6973 点击    2026-04-22 16:36
Vibe Coding 一句话能做联机对战了?实测 Kimi K2.6

Vibe Coding 一句话能做联机对战了?实测 Kimi K2.6

Vibe Coding 一句话能做联机对战了?实测 Kimi K2.6

Kimi 刚刚发布了 K2.6,Agent 模式也同步大升级。

来自主题: AI产品测评
8194 点击    2026-04-21 16:58
阿里官宣上线Happy Oyster,全网首发实测!

阿里官宣上线Happy Oyster,全网首发实测!

阿里官宣上线Happy Oyster,全网首发实测!

前段时间有个叫 Happy Horse 的模型实火了一把,在知名 AI 评测分析平台 Artificial Analysis 上,直接把 Seedance 2.0 挤到了第二。

来自主题: AI产品测评
6505 点击    2026-04-20 09:05
实测Claude Opus 4.7,好好的模型也开始不说人话了。

实测Claude Opus 4.7,好好的模型也开始不说人话了。

实测Claude Opus 4.7,好好的模型也开始不说人话了。

果不其然,最近一周Claude天天崩,就是为了新模型做储备。

来自主题: AI产品测评
5962 点击    2026-04-17 08:39
小时候追的超兽武装,被 AI 一点点带到了现实里

小时候追的超兽武装,被 AI 一点点带到了现实里

小时候追的超兽武装,被 AI 一点点带到了现实里

前两天我刷到一个工具的时候,第一反应其实不是拿真人照片试,也不是拿潮玩图试。

来自主题: AI产品测评
10227 点击    2026-04-14 14:58
我跑通了辅助起号Skill,新手也能直接抄~

我跑通了辅助起号Skill,新手也能直接抄~

我跑通了辅助起号Skill,新手也能直接抄~

最近我测试了一下,用AI辅助创作公众号小号,陆续发了一些文章,效果有点超预期。

来自主题: AI产品测评
10336 点击    2026-04-13 14:32
Kimi Beta内测模型实测,提升明显!

Kimi Beta内测模型实测,提升明显!

Kimi Beta内测模型实测,提升明显!

刚测完 Kimi K2.5,就拿到 Beta 版内测模型了。 一点喘息的机会都不给啊~~

来自主题: AI产品测评
7520 点击    2026-04-13 14:32
实测|我在扣子2.5里“养”出了一个懂我的数字生命

实测|我在扣子2.5里“养”出了一个懂我的数字生命

实测|我在扣子2.5里“养”出了一个懂我的数字生命

我以前一直觉得,所谓的 AI Agent,要么只是一个更聪明一点的对话框,要么就是一堆需要写代码、拼流程才能跑起来的自动化脚本。

来自主题: AI产品测评
8228 点击    2026-04-08 17:29
我的 Vibe Coding 项目

我的 Vibe Coding 项目

我的 Vibe Coding 项目

最近三个月,我用 Claude Code Vibe Coding 了几个项目,非常有意思,写篇文章记录一下。

来自主题: AI产品测评
9476 点击    2026-04-07 10:31
这次,我没有任何理由再用 PS 了

这次,我没有任何理由再用 PS 了

这次,我没有任何理由再用 PS 了

老粉都知道,我们团队一直坚持“小而美”,满打满算也才九个人,所以腾不出多余的人手来负责美工工作。

来自主题: AI产品测评
10077 点击    2026-04-07 10:01
AI 应用的下一站,是场景化 | 腾讯会议新功能第一时间评测

AI 应用的下一站,是场景化 | 腾讯会议新功能第一时间评测

AI 应用的下一站,是场景化 | 腾讯会议新功能第一时间评测

过去 3 年多时间里,从能云录制生成纪要,AI小助手做纪要总结,到元宝纪要再到 AI 托管,它一直在往会议流程里加入 AI 能力。近日,腾讯会议智能录制再次做了一次全面升级。我们深度体验后,和大家分享一手的体验和观察。

来自主题: AI产品测评
8196 点击    2026-04-06 08:57
Qwen3.6-Plus 深度测评报告

Qwen3.6-Plus 深度测评报告

Qwen3.6-Plus 深度测评报告

本报告基于XSCT Arena平台,对 Qwen3.6-Plus-Preview(阿里云,2026-04-02 发布)在文字能力(xsct-l)、网页生成(xsct-w)、Agentic 任务(xsct-a)三大场景下的表现进行系统评测,并与Claude Sonnet 4.6、GPT-5.4、Gemini 3.1 Pro、Kimi K2.5、

来自主题: AI产品测评
8955 点击    2026-04-04 16:19