AI资讯新闻榜单内容搜索-7

360智脑开源Light-R1！1000美元数学上首次从零超越DeepSeek-R1-Distill

2025 年 3 月 4 日，360 智脑开源了 Light-R1-32B 模型，以及全部训练数据、代码。仅需 12 台 H800 上 6 小时即可训练完成，从没有长思维链的 Qwen2.5-32B-Instruct 出发，仅使用 7 万条数学数据训练，得到 Light-R1-32B

来自主题: AI技术研报

5254 点击 2025-03-06 11:13

用AgenticLU长上下文理解，LLM澄清链CoC实现自学，答案召回率高达97.8% | 最新

LLM一个突出的挑战是如何有效处理和理解长文本。就像下图所示，准确率会随着上下文长度显著下降，那么究竟应该怎样提升LLM对长文本理解的准确率呢？

来自主题: AI技术研报

7486 点击 2025-03-06 09:54

【升级版】一句话生成高保真app原型图！Cursor + Claude 3.7 Sonnet让设计师危险了？

前两天，在下面这篇文章里，已经给大家介绍过通过一句话提示词生成app原型图，再截图让Cursor完成app开发的方法了。

来自主题: AI资讯

9238 点击 2025-03-05 14:22

Claude 3.7的编程能力太强了，强到会砸碎很多人的饭碗。

自从上周Claude 3.7 Sonnet发布，我的 X 就被这玩意刷屏了好几天。

来自主题: AI资讯

3875 点击 2025-03-05 14:17

“老黄骗人”！5070首批评测：说好1/3价格赛4090，实际不如4070Ti

一夜之间，RTX 5070被网友们喷成“史上最差的70系列”了。

来自主题: AI资讯

6067 点击 2025-03-05 14:06

Anthropic CPO 万字专访：不再只做模型！后悔没有更早做第一方产品

Anthropic 最近动作不断。

来自主题: AI资讯

5367 点击 2025-03-05 10:02

从 R1 到 Sonnet 3.7，Reasoning Model 首轮竞赛中有哪些关键信号？

DeepSeek R1 催化了 reasoning model 的竞争：在过去的一个月里，头部 AI labs 已经发布了三个 SOTA reasoning models：OpenAI 的 o3-mini 和deep research， xAI 的 Grok 3 和 Anthropic 的 Claude 3.7 Sonnet。

来自主题: AI技术研报

7624 点击 2025-03-05 09:39

全球征集开源 AI 项目共赴巴黎！GOSIM AI Spotlight 邀你开源创新面对面

GOSIM 是致力于为创新项目搭建全球化的开放、多元、包容的合作与发展平台。2025 年 5 月 6 - 7 日，GOSIM AI Paris 2025 大会将于在法国巴黎 Station F 举行，诚邀全球顶尖的 AI 专家、技术开发者、学者和开源创新者齐聚法国巴黎，共同探讨 AI 技术的未来发展。

来自主题: AI资讯

6249 点击 2025-03-05 09:01

谷歌科学家Nicholas Carlini：17个AI用法，让打工人效率翻倍

谷歌DeepMind 研究科学家 Nicholas Carlini，一位机器学习和计算机安全领域的大牛。以最贴近现实实用的角度，分享了他对大模型的看法，以及自己对大模型应用的50个案例。

来自主题: AI资讯

6148 点击 2025-03-05 08:49

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

本文构建了新的多轮组合图像检索数据集和评测基准FashionMT。其特点包括：（1）回溯性：每轮修改文本可能涉及历史参考图像信息（如保留特定属性），要求算法回溯利用多轮历史信息；（2）多样化：FashionMT包含的电商图像数量和类别分别是MT FashionIQ的14倍和30倍，且交互轮次数量接近其27倍，提供了丰富的多模态检索场景。

来自主题: AI技术研报

7381 点击 2025-03-05 08:46