AI资讯新闻榜单内容搜索-训练

深度学习的平衡之道：港科大、港城大等团队联合发布多目标优化最新综述

近年来，深度学习技术在自动驾驶、计算机视觉、自然语言处理和强化学习等领域取得了突破性进展。然而，在现实场景中，传统单目标优化范式在应对多任务协同优化、资源约束以及安全性 - 公平性权衡等复杂需求时，逐渐暴露出其方法论的局限性。

来自主题: AI技术研报

6738 点击 2025-03-19 10:30

240元打造擅长数学的多模态版R1，基于DeepSeek核心思想，两阶段训练提升推理能力至工业级应用标准

多模态大模型虽然在视觉理解方面表现出色，但在需要深度数学推理的任务上往往力不从心，尤其是对于参数量较小的模型来说更是如此。

来自主题: AI技术研报

6106 点击 2025-03-19 09:43

全球首个工业界多模态推理模型开源！38B硬刚DeepSeek-R1，训练秘籍全公开

全球首个开源多模态推理大模型来了！38B参数模型性能直逼DeepSeek-R1，同尺寸上横扫多项SOTA。而这家中国公司之所以选择无偿将技术思路开源，正是希望同DeepSeek一样，打造开源界的技术影响力。

来自主题: AI技术研报

11430 点击 2025-03-18 19:19

先别骂队友，上交如何让DeepSeek R1在分手厨房再也不糊锅？

在春节的 DeepSeek 大热后，大模型也更多走进了大家的生活。我们越来越多看到各种模型在静态的做题榜单击败人类，解决各种复杂推理问题。但这些静态的测试与模型在现实中的应用还相去甚远。模型除了能进行对话，还在许多更复杂的场景中以各种各样的方式与人类产生互动。除了对话任务外，如何实现大模型与人的实时同步交互协作越来越重要。

来自主题: AI技术研报

4627 点击 2025-03-18 17:30