AI资讯新闻榜单内容搜索-多模态

刚刚，这款Agent浏览器力压OpenAI，72%成功率全球第一！还能免费用

工具越多，效率越低？在信息洪流里，我们被无尽的切换与复制粘贴拖住了脚。Fellou让每个人都重获跨领域创造力，做自己的数字达芬奇：交互、任务、记忆三大连续体无缝衔接，Deep Search与Visual Report免费开放，跨应用自动执行、多模态创作与动态工作流一站打通。

来自主题: AI资讯

9801 点击 2025-09-10 13:01

字节Seedream 4.0将全量开放！抢先评测来了，我们摸索出AI生图一大波「邪修」玩法

打开多模态自由创作的大门。

来自主题: AI产品测评

8117 点击 2025-09-09 12:29

具身VLA后训练：TeleAI提出潜空间引导的VLA跨本体泛化方法

在多模态大模型的基座上，视觉 - 语言 - 动作（Visual-Language-Action, VLA）模型使用大量机器人操作数据进行预训练，有望实现通用的具身操作能力。

来自主题: AI技术研报

5972 点击 2025-09-08 15:20

苹果端侧AI两连发！模型体积减半、首字延迟降85倍，iPhone离线秒用

苹果在 Hugging Face上放大招了！这次直接甩出两条多模态主线：FastVLM主打「快」，字幕能做到秒回；MobileCLIP2主打「轻」，在 iPhone 上也能起飞。更妙的是，模型和Demo已经全开放，Safari网页就能体验。大模型，真·跑上手机了。

来自主题: AI资讯

7860 点击 2025-09-08 11:34

视频理解新标杆，快手多模态推理模型开源：128k上下文+0.1秒级视频定位+跨模态推理

能看懂视频并进行跨模态推理的大模型Keye-VL 1.5，快手开源了。

来自主题: AI技术研报

7188 点击 2025-09-06 12:44

多模态大模型持续学习系列研究，综述+Benchmark+方法+Codebase一网打尽！

近年来，生成式 AI 和多模态大模型在各领域取得了令人瞩目的进展。然而，在现实世界应用中，动态环境下的数据分布和任务需求不断变化，大模型如何在此背景下实现持续学习成为了重要挑战

来自主题: AI技术研报

7746 点击 2025-09-06 11:50

DeepSeek、GPT-5都在尝试的快慢思考切换，有了更智能版本，还是多模态

当前，业界顶尖的大模型正竞相挑战“过度思考”的难题，即无论问题简单与否，它们都采用 “always-on thinking” 的详细推理模式。无论是像 DeepSeek-V3.1 这种依赖混合推理架构提供需用户“手动”介入的快慢思考切换，还是如 GPT-5 那样通过依赖庞大而高成本的“专家路由”机制提供的自适应思考切换。

来自主题: AI技术研报

6371 点击 2025-09-02 12:27

苹果最新模型，5年前的iPhone能跑

智东西9月1日消息，苹果又公布了大模型研发新进展！ 8月28日，苹果在arXiv发布新论文，介绍新一代多模态基础模型MobileCLIP2及其背后的多模态强化训练机制，同天在GitHub、Hugging Face上开源了模型的预训练权重和数据生成代码。

来自主题: AI技术研报

6897 点击 2025-09-02 11:04

更懂国内APP的开源智能体！感知/定位/推理/中文能力全面提升，还能自己学会操作

最新开源多模态智能体，能自动操作手机、电脑、浏览器的那种！开源评测榜单和中文场景交互成绩全面提升。

来自主题: AI技术研报

8285 点击 2025-09-01 10:55

元石科技正式发布问小白5，性能直追GPT-5

本月初，AI 圈翘首以盼的 GPT-5 终于问世，在数学、实际编程、多模态理解、推理等多个领域实现了新的 SOTA。今日，国产 AI 厂商元石科技重磅推出「All in One」旗舰模型 —— 问小白 5，成为其迄今为止最智能、最快捷、最实用的 AI 系统。尤其值得强调的是：问小白 5 的各项基准测试榜单成绩最接近 GPT-5，这使其成为当前国产大模型中最具代表性的对标者。

来自主题: AI资讯

6712 点击 2025-08-29 14:14