AI资讯新闻榜单内容搜索-LLaMA

超越DeepSeek V3！Ai2再祭开源杀器Tülu 3，强化学习打破性能瓶颈

2024年11月，艾伦人工智能研究所（Ai2）推出了Tülu 3 8B和70B，在性能上超越了同等参数的Llama 3.1 Instruct版本，并在长达82页的论文中公布其训练细节，训练数据、代码、测试基准一应俱全。

来自主题: AI技术研报

6152 点击 2025-02-05 16:54

杭州超越杭州：阿里Qwen2.5-Max反超DeepSeek-V3！网友：中国AI正在快速缩小差距

刚刚，大模型竞技场榜单上再添一款国产模型——来自阿里，Qwen2.5-Max，超越了DeepSeek-V3，以总分1332的成绩位列总榜第七。同时还一举超越Claude 3.5 Sonnet、Llama 3.1 405B等模型。

来自主题: AI资讯

6746 点击 2025-02-05 11:19

曝DeepSeek让Llama4未发布已落后！小扎坐不住了：2025预算4000亿起步，年底AI算力将达130万卡

Meta这次真的坐不住了，计划在AI上继续加码！匿名员工爆料，黑马DeepSeek的出现，让Llama 4还未发布就已经落后，Meta慌了。

来自主题: AI资讯

6841 点击 2025-01-26 00:01

Meta陷入恐慌？内部爆料：在疯狂分析复制DeepSeek，高预算难以解释

「工程师正在疯狂地分析 DeepSeek，试图从中复制任何可能的东西。」DeepSeek 开源大模型的阳谋，切切实实震撼着美国 AI 公司。最先陷入恐慌的，似乎是同样推崇开源的 Meta。

来自主题: AI资讯

6781 点击 2025-01-24 10:59

Atom Capital：中美AI最前沿——创投新趋势、中美竞争与初创企业出海战略

2024又是AI精彩纷呈的一年。LLM不再是AI舞台上唯一的主角。随着预训练技术遭遇瓶颈，GPT-5迟迟未能问世，从业者开始从不同角度寻找突破。以o1为标志，大模型正式迈入“Post-Training”时代；开源发展迅猛，Llama 3.1首次击败闭源模型；中国本土大模型DeepSeek V3，在GPT-4o发布仅7个月后，用 1/10算力实现了几乎同等水平。

来自主题: AI资讯

7467 点击 2025-01-19 10:38