AI资讯新闻榜单内容搜索-模型

ICLR 2026｜多模态大模型真的理解情绪吗？MME-Emotion给出了系统答案

近年来，多模态大模型（Multimodal Large Language Models, MLLMs）正在迅速改变人工智能的能力边界。从图像理解到视频分析，从语音对话到复杂推理，大模型正在逐步具备类似人类的综合感知能力。但一个关键问题仍然没有得到充分回答：这些模型真的能够理解人类情绪吗？

来自主题: AI技术研报

7117 点击 2026-03-16 14:27

DeepRead让AI像人一样阅读文档：利用OCR识别章节结构，先精准定位相关段落，再完整读取上下文，避免碎片化检索。实验显示，其长文档问答准确率提升17%，能自动跳过冗余信息，精准提取财报、论文等复杂内容，无需额外知识图谱，轻量高效。

来自主题: AI资讯

8777 点击 2026-03-16 14:26

在当前的 LLM 开发中，后训练阶段通常被视为赋予模型特定能力的关键环节。传统的观点认为，模型必须通过强化学习（如 PPO、GRPO 或 RLHF）和进化策略（ES）等算法，在反复的迭代和梯度优化过程中调整权重，才能在特定任务上达到理想的性能。

来自主题: AI技术研报

6455 点击 2026-03-16 14:26

多模态大模型在代码能力上进步惊人，但在基础视觉任务上却频繁失误。UniPat AI 构建了一个极简的视觉智能体框架 ——SWE-Vision，让模型可以编写并执行 Python 代码来处理和验证自己的视觉判断。在五个主流视觉基准测试中，SWE-Vision 均达到了当前最优水平。

来自主题: AI技术研报

9792 点击 2026-03-16 14:25

我们推出GLM-5-Turbo——一个面向OpenClaw龙虾场景深度优化的基座模型。体验过OpenClaw的用户都有一个共同感受：模型能聊好天，但未必能干好活。问题的根源不在框架，而在底层模型本身

来自主题: AI资讯

10498 点击 2026-03-16 11:38

国产大模型集体“中毒”，虚假产品“毒害”消费者。

来自主题: AI资讯

6924 点击 2026-03-16 10:42

你随手拍下一张照片，AI也许只会夸“真好看”，却说不出一句真正有用的建议。

来自主题: AI技术研报

6223 点击 2026-03-16 10:38

自2025年10月Claude正式确立Agent Skills规范以来，Agent能力的边界正在被暴涨的脚本仓库迅速拓宽。截至2026年2月末，公开可用的Skills数量已突破28万大关。回顾过去半年，Skills开发的火力几乎全集中在了“供给侧”，而且绝大多数由分散的第三方开发者维护。

来自主题: AI技术研报

7265 点击 2026-03-16 09:53

先提前预告下，这个项目解决不了不赚钱的问题，但能帮助减少冲动交易，解决信息搜集、分析效率低问题。当然，也有同事吐槽，这是个韭菜RL，大家有选择地参考与批判一下就好。

来自主题: AI技术研报

7738 点击 2026-03-16 09:50

最近，一个叫OpenClaw(小龙虾)的开源项目突然爆火，甚至出现线下排队安装的场面。很多人第一次直观地看到，AI不只是chatbot，而是可以真正“动手”操作电脑、完成复杂任务和个性化工作流的智能体。这意味着AI正在进入下半场，开始走向真实应用，并逐渐进入普通人的日常生活。

来自主题: AI技术研报

9217 点击 2026-03-16 09:50