AI资讯新闻榜单内容搜索-视觉

Kimi 16B胜GPT-4o！开源视觉推理模型：MoE架构，推理时仅激活2.8B

刚刚，Kimi团队上新了！

来自主题: AI技术研报

6841 点击 2025-04-10 16:25

jina-reranker-m0 全新多模态多语言重排器

今天，我们正式发布jina-reranker-m0。这是一款多模态、多语言重排器（reranker），其核心能力在于对包含丰富视觉元素的文档进行重排和精排，同时兼容跨语言场景。

来自主题: AI技术研报

6345 点击 2025-04-09 17:03

速递｜设计师打造可视化拖拽编辑，贝恩资本领投8300万美元，一站式AI创意平台Krea5亿美元估值

一家名为 Krea 的初创公司正致力于服务设计师及其他视觉创意工作者，解决一站式生成难题，并已为其平台筹集了 8300 万美元资金，该平台旨在让生成式 AI 的使用更加流畅。

来自主题: AI资讯

6468 点击 2025-04-09 16:40

迈向机器人领域ImageNet，大牛Pieter Abbeel领衔国内外高校共建RoboVerse，统一仿真平台、数据集和基准

大规模数据集和标准化评估基准显著促进了自然语言处理和计算机视觉领域的发展。然而，机器人领域在如何构建大规模数据集并建立可靠的评估体系方面仍面临巨大挑战。

来自主题: AI技术研报

7047 点击 2025-04-09 08:59

类R1强化学习迁移到视觉定位！全开源Vision-R1将图文大模型性能提升50％

图文大模型通常采用「预训练 + 监督微调」的两阶段范式进行训练，以强化其指令跟随能力。受语言领域的启发，多模态偏好优化技术凭借其在数据效率和性能增益方面的优势，被广泛用于对齐人类偏好。目前，该技术主要依赖高质量的偏好数据标注和精准的奖励模型训练来提升模型表现。然而，这一方法不仅资源消耗巨大，训练过程仍然极具挑战。

来自主题: AI技术研报

9142 点击 2025-04-08 14:18