
历史分水岭:DeepSeek GitHub星数超越OpenAI!大佬揭秘仅用450美元训推理模型
历史分水岭:DeepSeek GitHub星数超越OpenAI!大佬揭秘仅用450美元训推理模型就在刚刚,历史性的一刻出现了。DeepSeek项目在GitHub平台上的Star数,已经超越了OpenAI。热度最高的DeepSeek-V3,Star数如今已达7.7万。
就在刚刚,历史性的一刻出现了。DeepSeek项目在GitHub平台上的Star数,已经超越了OpenAI。热度最高的DeepSeek-V3,Star数如今已达7.7万。
Ilya Sutskever,带着新消息又出现了——创办的公司SSI(Safe SuperIntelligence),正在进行新一轮融资洽谈。目标:估值至少200亿美元。
DeepSeek跟ChatGPT下了一把国际象棋,然后……通过忽悠的方式,竟让ChatGPT直接认输!DeepSeek在这场对决中有多离谱呢?兵当马走吃皇后……象直接飞到敌军腹地……
谷歌DeepMind最新数学AI,一举解决了2000-2024年IMO竞赛中84%的几何问题。AlphaGeometry2论文发布,在总共50道题中完成了42道,相比去年的一代多完成了15道。
苹果最新论文揭露,或许它们看起来不会像机器人,或许它们将无处不在!苹果放出来一个台灯机器人以做展示,火遍reddit、X等平台。
在处理这类复杂任务的过程中,大模型智能体将问题分解为可执行的工作流(Workflow)是关键的一步。然而,这一核心能力目前缺乏完善的评测基准。为解决上述问题,浙大通义联合发布WorfBench——一个涵盖多场景和复杂图结构工作流的统一基准,以及WorfEval——一套系统性评估协议,通过子序列和子图匹配算法精准量化大模型生成工作流的能力。
2024年,中国AI创业者以惊人的速度在全球狂飙向前,在教育、娱乐和生产力工具等领域跑出一批表现优异的出海产品,其中不乏月度活跃用户超千万、赚钱能力极强的应用。
如今,AI爆发趋势势不可挡,从去年开始,内容生成领域就备受瞩目,无论是文生还是图生,都让创作变得轻而易举,也让更多的非原专业人士能够参与其中,体验用极短的时间制作出心仪的内容。
月6日,专注于下一代人工智能技术的公司Paige近日宣布其旗舰产品Paige PanCancer Detect实现了重大升级。这款AI应用是首个能够检测多种组织和器官癌症的工具,最初于2024年初推出时已能帮助病理学家检测超过17种不同的组织癌症。
昨天,#雷军劝年轻人尽快学会AI#的话题词冲上热搜,狂揽1.5亿的阅读量。
近期,有部分消费者向亿欧反馈,此前预售火爆的闪极AI拍拍镜,并未按期交付。“本来想春节期间炫一下,结果迎来了退款的尴尬局面。”
对于AI陪伴硬件,我们是最早深入关注的平台之一,今年的CES,AI陪伴硬件是除了AI眼镜、AI机器人外最受关注的产品,在各类媒体以及投资界的追捧下,AI陪伴硬件来到了风口之上。
DeepSeek的V3模型仅用557.6万的训练成本,实现了与OpenAI O1推理模型相近的性能,这在全球范围内引发连锁反应。由于不用那么先进的英伟达芯片就能实现AI能力的飞跃,英伟达在1月27日一天跌幅高达17%,市值一度蒸发6000亿美元。
“如何用DeepSeek赚到100万”“DeepSeek带你躺着赚钱”......在社交媒体上,频频能看到教你如何用DeepSeek实现一夜暴富,在淘宝、闲鱼等平台上,不少商家打着“本地部署”的概念兜售DeepSeek接入教程,标价最高达到10万元,最低仅有0.01元。
现在,要想往视频里毫无违和感地添加任何东西,只需一张图就够了。
欧洲OpenAI”Mistral AI有新动作了! Le Chat(法语“猫”)全新升级,官方自称它是“您生活和工作的终极AI助手”。
在竞争激烈的游戏行业,创新技术一直是重塑着行业格局的关键,而最近几年,AI无疑是风口上的香饽饽,全球范围内各种创业团队更是如雨后春笋般涌现
IEEE/CVF国际计算机视觉与模式识别会议(CVPR)是人工智能领域最具学术影响力的顶级会议之一,将于今年 6月11日至6月15日在美国田纳西州举行。
近日有媒体报道称,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。
今年爆火的国产AI应用DeepSeek化身最火爆的赛博算命师,各种东西方玄学,如《三命通会》、《滴天髓》、《渊海子平》这些你压根没听过的书籍,只需要它“深度思考”几秒钟就能手到擒来。
在整个春节期间,DeepSeek的一夜爆火令人印象深刻,无论公域还是私域场合都随处听到讨论它的声音。而我们注意到其开发商杭州深度求索人工智能基础技术研究有限公司是一家成立仅一年半的新公司 (背后的量化私募公司运营时间较久) 。
AI的新进展频频,人才动态也愈加重磅。 新年第一则大牛人事动向,引发业内关注。 许主洪,IEEE Fellow,新加坡管理大学终身教授,被曝加盟阿里。
在蛇年春晚中,宇树科技研发的人形机器人身穿东北特色的花棉袄,扭秧歌转手绢,人机共舞的场面让观众印象深刻。这次舞台,再次将具身智能推至聚光灯下。
各位同学好,我是来自 Unlock-DeepSeek 开源项目团队的骆师傅。先说结论,我们(Datawhale X 似然实验室)使用 3 张 A800(80G) 计算卡,花了 20 小时训练时间,做出了可能是国内首批 DeepSeek R1 Zero 的中文复现版本,我们把它叫做 Datawhale-R1,用于 R1 Zero 复现教学。
阿里系第一个吃上DeepSeek“螃蟹”的出现了——钉钉:已经全面接入DeepSeek系列模型。现在,用户在钉钉上创建AI助理的时候,可以直接选择DeepSeek系列的R1、V3等三种模型!
自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。
刚刚,AI大牛吴恩达官宣创业公司新成果——Agentic Object Detection
尽管多模态大语言模型(MLLM)在简单任务上最近取得了显著进展,但在复杂推理任务中表现仍然不佳。费曼的格言可能是这种现象的完美隐喻:只有掌握推理过程的每一步,才能真正解决问题。然而,当前的 MLLM 更擅长直接生成简短的最终答案,缺乏中间推理能力。本篇文章旨在开发一种通过学习创造推理过程中每个中间步骤直至最终答案的 MLLM,以实现问题的深入理解与解决。
SANA 1.5是一种高效可扩展的线性扩散Transformer,针对文本生成图像任务进行了三项创新:高效的模型增长策略、深度剪枝和推理时扩展策略。这些创新不仅大幅降低了训练和推理成本,还在生成质量上达到了最先进的水平。
新一代 Kaldi 团队是由 Kaldi 之父、IEEE fellow、小米集团首席语音科学家 Daniel Povey 领衔的团队,专注于开源语音基础引擎研发,从神经网络声学编码器、损失函数、优化器和解码器等各方面重构语音技术链路,旨在提高智能语音任务的准确率和效率。