
DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能
DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能DeepSeek放大招!新模型专注数学定理证明,大幅刷新多项高难基准测试。在普特南测试上,新模型DeepSeek-Prover-V2直接把记录刷新到49道。目前的第一名在657道题中只做出10道题,为Kimi与AIME2024冠军团队Numina合作成果Kimina-Prover。
DeepSeek放大招!新模型专注数学定理证明,大幅刷新多项高难基准测试。在普特南测试上,新模型DeepSeek-Prover-V2直接把记录刷新到49道。目前的第一名在657道题中只做出10道题,为Kimi与AIME2024冠军团队Numina合作成果Kimina-Prover。
4月29日,习近平总书记在上海考察时,在中共中央政治局委员、上海市委书记陈吉宁和市长龚正陪同下,来到位于徐汇区的上海“模速空间”大模型创新生态社区调研。
刚刚,LMArena陷入了巨大争议,斯坦福MIT和Ai2等的研究者联手发论文痛斥,这个排行榜已经被Meta等公司利用暗中操作排名!Karpathy也下场帮忙锤了一把。而LMArena官方立马回应:论文存在多处错误,指控不实。
来自英伟达和UIUC的华人团队提出一种高效训练方法,将LLM上下文长度从128K扩展至惊人的400万token SOTA纪录!基于Llama3.1-Instruct打造的UltraLong-8B模型,不仅在长上下文基准测试中表现卓越,还在标准任务中保持顶尖竞争力。
渤海湾畔,天津空港经济区内,春风正轻拂天津市第一中学滨海学校(以下简称为「天津一中滨海学校」)。在这座雅名「葵园」的学校里,师生们正雀跃着走进两间由联想开天打造的「未来教室」,「信创+AI」教育的全新生态,也在春日中悄然萌发。
连证件照都能在家用AI搞定,介么不是魔法嘛!这就是Aragon AI,一款利用AI生成专业证件照的软件,让人不出家门就能得到逼真的证件照。
在人工智能领域,语言模型的发展日新月异,推理能力作为语言模型的核心竞争力之一,一直是研究的焦点,许多的 AI 前沿人才对 AI 推理的效率进行研究。
这就是为什么数据被称作"新石油"或"新黄金"——它极其珍贵,因为算法的一切认知都来源于输入的数据。
Agent赛道热闹非凡,周鸿祎力推的纳米AI搜索,体验上能有什么不一样?
我是没想到,GPT4o用一段小小的Prompt生成的一些图片,引发的热度浪潮。