32B IOI奥赛击败DeepSeek-R1!Open R1开源复刻第三弹,下一步R1-Zero
32B IOI奥赛击败DeepSeek-R1!Open R1开源复刻第三弹,下一步R1-ZeroHugging Face的Open R1重磅升级,7B击败Claude 3.7 Sonnet等一众前沿模型。凭借CodeForces-CoTs数据集的10万高质量样本、IOI难题的严苛测试,以及模拟真实竞赛的提交策略优化,这款模型展现了惊艳的性能。
Hugging Face的Open R1重磅升级,7B击败Claude 3.7 Sonnet等一众前沿模型。凭借CodeForces-CoTs数据集的10万高质量样本、IOI难题的严苛测试,以及模拟真实竞赛的提交策略优化,这款模型展现了惊艳的性能。
来自北京的赵明(化名),近期自认栽了个跟头——花费近6000元为三年级孩子购置的AI学习机,宣传的“AI精准辅导”“一对一伴学”功能与实际严重不符,仅用了一个月就“吃土”了。事实上,多数家长都很难逃出学习机的困扰。小红书平台上,与学习机相关的笔记多达131万篇,关联词条中不乏:学习机到底是不是智商税、学习机有没有必要买等话题。
DiffRhythm是一款新型AI音乐生成模型,能在10秒内生成长达4分45秒的完整歌曲,包含人声和伴奏。它采用简单高效的全diffusion架构,仅需歌词和风格提示即可创作,还支持本地部署,最低只需8G显存。
揭秘如何在 20 分钟内用 AI 创建专业级界面,并分享前四大核心技巧,让你的 AI 生成的应用脱胎换骨。
大模型时代,读论文这事儿真是越来越爽了~
去年获得最多精神养分的创业故事,来自 Dify 创始人张路宇。
2025 年 2 月发布的 NoLiMA 是一种大语言模型(LLM)长文本理解能力评估方法。不同于传统“大海捞针”(Needle-in-a-Haystack, NIAH)测试依赖关键词匹配的做法,它最大的特点是 通过精心设计问题和关键信息,迫使模型进行深层语义理解和推理,才能从长文本中找到答案。
这才 2 月份,深度搜索(Deep Search)就已经隐隐成为 2025 年的新搜索标准了。像谷歌和 OpenAI 这样的巨头,纷纷亮出自己的“Deep Research”产品,努力抢占这波技术浪潮的先机。(我们也很自豪,在同一天也发布了开源的node-deepresearch)。
在 ChatGPT 爆火两年多的时间里,大语言模型的上下文窗口长度基准线被拉升,以此为基础所构建的长 CoT 推理、多 Agent 协作等类型的高级应用也逐渐增多。
3月6日上午,宁波市妇女儿童医学中心的产房中,小名思思的孩子呱呱坠地,医护人员为她进行了血氧饱和度测试以及心脏听诊,数据同步至“CHANGE大模型”(中文名启元大模型),几十秒钟后,大模型给出了“阳性”的红字提示,“是先天性心脏病,但是情况不严重,做好随访,3岁之前做一个微创手术就能根治。”医生安慰着思思的父母。