AI资讯新闻榜单内容搜索-GUI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GUI
港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法

港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法

港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法

现有的方法对大语言模型(LLM)「越狱」攻击评估存在误判和不一致问题。港科大团队提出了GuidedBench评估框架,通过为每个有害问题制定详细评分指南,显著降低了误判率,揭示了越狱攻击的真实成功率远低于此前估计,并为未来研究提供了更可靠的评估标准。

来自主题: AI技术研报
5631 点击    2025-08-02 13:15
手机AGI助手还有多远?移动智能体复合长程任务测试基准与调度系统发布

手机AGI助手还有多远?移动智能体复合长程任务测试基准与调度系统发布

手机AGI助手还有多远?移动智能体复合长程任务测试基准与调度系统发布

多模态大模型 (MLLM) 驱动的 OS 智能体在单屏动作落实(如 ScreenSpot)、短链操作任务(如 AndroidControl)上展现出突出的表现,标志着端侧任务自动化的初步成熟。

来自主题: AI技术研报
6568 点击    2025-07-27 13:01
别用语言描述,直接点!Lovart 正式版把 AI 交互卷到新变态级别

别用语言描述,直接点!Lovart 正式版把 AI 交互卷到新变态级别

别用语言描述,直接点!Lovart 正式版把 AI 交互卷到新变态级别

大家好,我是歸藏(guizang),今天给大家带来 Lovart 的正式版一手介绍和体验。Lovart 我们介绍过很多次了,但是每次都会有新东西。 昨晚看到他们的推特,发现发了正式版,就赶紧试了一下。 今天这个设计 Agent 终于变成了一个完全体,而且这次的更新依然非常牛批。

来自主题: AI资讯
6076 点击    2025-07-24 15:55
任务级奖励提升App Agent思考力,淘天提出Mobile-R1,3B模型可超32B

任务级奖励提升App Agent思考力,淘天提出Mobile-R1,3B模型可超32B

任务级奖励提升App Agent思考力,淘天提出Mobile-R1,3B模型可超32B

现有Mobile/APP Agent的工作可以适应实时环境,并执行动作,但由于它们大部分都仅依赖于动作级奖励(SFT或RL)。

来自主题: AI技术研报
9736 点击    2025-07-21 12:25
彻底压榨潜能!我用 Kimi K2 写了一套前端组件库

彻底压榨潜能!我用 Kimi K2 写了一套前端组件库

彻底压榨潜能!我用 Kimi K2 写了一套前端组件库

大家好,我是歸藏(guizang),今天展示一下我用 Kimi K2 实现的一套组件库,以及K2 替代 Claude Code 的默认模型的教程补充。

来自主题: AI技术研报
7452 点击    2025-07-15 13:33
Kimi K2 详测|超强代码和Agent 能力!内附Claude Code邪修教程

Kimi K2 详测|超强代码和Agent 能力!内附Claude Code邪修教程

Kimi K2 详测|超强代码和Agent 能力!内附Claude Code邪修教程

大家好,我是歸藏(guizang),熬夜给大家带来 Kimi K2 模型和提升K2模型的CC+K2邪修教程。大家好,我是歸藏(guizang),熬夜给大家带来 Kimi K2 模型和提升K2模型的CC+K2邪修教程。

来自主题: AI产品测评
8608 点击    2025-07-12 09:42