AI资讯新闻榜单内容搜索-英伟达大模型

「DeepSeek二代」来袭！数学暴击o3，英伟达开源LLM登顶

基于Qwen2.5架构，采用DeepSeek-R1-0528生成数据，英伟达推出的OpenReasoning-Nemotron模型，以超强推理能力突破数学、科学、代码任务，在多个基准测试中创下新纪录！数学上，更是超越了o3!

来自主题: AI资讯

10432 点击 2025-07-20 23:43

英伟达最强通用大模型Nemotron-4登场！15B击败62B，目标单张A100/H100可跑

许久未更新大模型的英伟达推出了150亿参数的Nemotron-4，目标是打造一个能在单个A100/H100可跑的通用大模型。

来自主题: AI技术研报

7543 点击 2024-02-29 13:58

英伟达新对话QA模型准确度超GPT-4，却遭吐槽：无权重代码意义不大

昨天，Meta、纽约大学的研究者用「自我奖励方法」，让大模型自己生成自己的微调数据，从而在 Llama 2 70B 的迭代微调后超越了 GPT-4。今天，英伟达的全新对话 QA 模型「ChatQA-70B」在不使用任何 GPT 模型数据的情况下，在 10 个对话 QA 数据集上的平均得分略胜于 GPT-4。

来自主题: AI资讯

11413 点击 2024-01-21 14:27