AI资讯新闻榜单内容搜索-模型

DeepSeek火了，淘金者失落，卖铲者狂欢

今天凌晨，亚马逊云科技宣布在Amazon Bedrock平台上推出全托管、无服务器的DeepSeek-R1模型，是首个提供DeepSeek-R1作为全托管、正式商用模型的海外云厂商。

来自主题: AI资讯

9922 点击 2025-03-11 23:15

在32道高等数学测试中，LLM表现出色，平均能得分90.4(按百分制计算)。GPT-4o和Mistral AI更是几乎没错！向量计算、几何分析、积分计算、优化问题等，高等AI模型轻松拿捏。研究发现，再提示（Re-Prompting）对提升准确率至关重要。

来自主题: AI技术研报

10115 点击 2025-03-11 18:38

硅基智能开源数字人模型，1秒克隆生成4K视频，支持离线多语言。GitHub可部署。

来自主题: AI资讯

12454 点击 2025-03-11 17:57

首次将DeepSeek同款RLVR应用于全模态LLM，含视频的那种！

来自主题: AI技术研报

9003 点击 2025-03-11 17:34

挑战多图数学推理新基准，大模型直接全军覆没？！

来自主题: AI技术研报

8421 点击 2025-03-11 17:22

前段时间，幻方科技、DeepSeek 创始人梁文锋亲自挂名的一篇论文传遍了全球互联网。

来自主题: AI资讯

7580 点击 2025-03-11 17:11

没有任何冷启动数据，7B 参数模型能单纯通过强化学习学会玩数独吗？

来自主题: AI技术研报

9531 点击 2025-03-11 17:03

o1/o3这样的推理模型太强大，一有机会就会利用漏洞作弊，怎么办？

来自主题: AI资讯

6545 点击 2025-03-11 16:35

武汉大学等发布了一篇大型视觉语言模型（LVLMs）安全性的综述论文，提出了一个系统性的安全分类框架，涵盖攻击、防御和评估，并对最新模型DeepSeek Janus-Pro进行了安全性测试，发现其在安全性上存在明显短板。

来自主题: AI技术研报

8358 点击 2025-03-11 16:32

本文介绍了一项突破性的AI推理技术创新——思维草图(SoT)框架。该框架从人类认知过程中获取灵感，通过一个200M大小的路由模型将LLM引导到概念链、分块符号化和专家词汇三种推理范式，巧妙地解决了大语言模型推理过程中的效率瓶颈。

来自主题: AI技术研报

7812 点击 2025-03-11 16:21