AI资讯新闻榜单内容搜索-模型训练

DeepSeek-V3.2巨「吃」Token，竟然是被GRPO背刺了

DeepSeek 一发布模型，总会引起业内的高度关注与广泛讨论，但也不可避免的暴露出一些小 Bug。

来自主题: AI技术研报

5793 点击 2025-12-05 10:05

超越π0.5，复旦团队首创「世界模型+具身训练+强化学习」闭环框架

Vision–Language–Action（VLA）策略正逐渐成为机器人迈向通用操作智能的重要技术路径：这类策略能够在统一模型内同时处理视觉感知、语言指令并生成连续控制信号。

来自主题: AI技术研报

8356 点击 2025-12-05 09:27

Code LLM全景综述，从LLM到Agent，全文长303页，北航阿里字节等12家机构联合撰写｜最新

这篇论文由北京航空航天大学、阿里巴巴、字节跳动、上海人工智能实验室等几十家顶尖机构联合撰写，全文长达303页，是对当前“代码大模型（Code LLMs）”领域最详尽的百科全书式指南。

来自主题: AI技术研报

10611 点击 2025-12-05 09:24

语义+R-Tree空间索引：Milvus如何帮外卖APP做3公里内美食推荐| Milvus Week

本文为Milvus Week系列第三篇，该系列旨在分享Milvus的创新与实践成果，以下是DAY3内容划重点： Milvus2.6中，Zilliz借助Geolocation Index for Milvus，首次将地理空间数据与向量检索融合，使 AI 可以在理解语义的同时，理解空间。

来自主题: AI技术研报

9821 点击 2025-12-05 09:22

首个英文原生「弱智吧」！逻辑谬误数据集与生成框架来了 | AAAI'26

最近研究发现，大模型在判断逻辑谬误时容易「想太多」，误报正常句子，但在确定有谬误后，其分类能力较强。研究人员构建了首个高质量英文逻辑谬误基准SMARTYPAT-BENCH，并开发了基于Prolog的逻辑谬误自动生成框架SMARTYPAT，为大模型逻辑能力评估提供新思路，可用于谬误识别、辩论教育等领域。

来自主题: AI技术研报

9050 点击 2025-12-05 09:19