AI资讯新闻榜单内容搜索-

去年近 60 家 AI 初创公司成立一年内获投，创始人不乏大厂背景

在整个春节期间，DeepSeek的一夜爆火令人印象深刻，无论公域还是私域场合都随处听到讨论它的声音。而我们注意到其开发商杭州深度求索人工智能基础技术研究有限公司是一家成立仅一年半的新公司（背后的量化私募公司运营时间较久）。

来自主题: AI资讯

7284 点击 2025-02-07 19:13

全球顶级AI科学家许主洪加盟阿里！IEEE Fellow，五万被引论文数，曾任Salesforce集团副总裁

AI的新进展频频，人才动态也愈加重磅。新年第一则大牛人事动向，引发业内关注。许主洪，IEEE Fellow，新加坡管理大学终身教授，被曝加盟阿里。

来自主题: AI资讯

7891 点击 2025-02-07 19:04

具身智能，掀起融资风暴

在蛇年春晚中，宇树科技研发的人形机器人身穿东北特色的花棉袄，扭秧歌转手绢，人机共舞的场面让观众印象深刻。这次舞台，再次将具身智能推至聚光灯下。

来自主题: AI资讯

7727 点击 2025-02-07 18:50

DeepSeek R1 Zero中文复现教程来了！

各位同学好，我是来自 Unlock-DeepSeek 开源项目团队的骆师傅。先说结论，我们（Datawhale X 似然实验室）使用 3 张 A800(80G) 计算卡，花了 20 小时训练时间，做出了可能是国内首批 DeepSeek R1 Zero 的中文复现版本，我们把它叫做 Datawhale-R1，用于 R1 Zero 复现教学。

来自主题: AI技术研报

10016 点击 2025-02-07 17:54

钉钉真勇！率先接入DeepSeek，阿里系第一个吃螃蟹

阿里系第一个吃上DeepSeek“螃蟹”的出现了——钉钉：已经全面接入DeepSeek系列模型。现在，用户在钉钉上创建AI助理的时候，可以直接选择DeepSeek系列的R1、V3等三种模型！

来自主题: AI资讯

8686 点击 2025-02-07 17:06

DeepSeek用的GRPO占用大量内存？有人给出了些破解方法

自 DeepSeek-R1 发布以来，群组相对策略优化（GRPO）因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM（DeepSeek-v3）的基本指令转变为推理模型（DeepSeek-R1）。

来自主题: AI技术研报

7598 点击 2025-02-07 16:53

吴恩达押注Agent新成果官宣！零样本标记实现图片目标检测

刚刚，AI大牛吴恩达官宣创业公司新成果——Agentic Object Detection

来自主题: AI资讯

11171 点击 2025-02-07 16:19

将集体学习引入树搜索，新方法CoMCTS实现o1-like的推理与反思

尽管多模态大语言模型（MLLM）在简单任务上最近取得了显著进展，但在复杂推理任务中表现仍然不佳。费曼的格言可能是这种现象的完美隐喻：只有掌握推理过程的每一步，才能真正解决问题。然而，当前的 MLLM 更擅长直接生成简短的最终答案，缺乏中间推理能力。本篇文章旨在开发一种通过学习创造推理过程中每个中间步骤直至最终答案的 MLLM，以实现问题的深入理解与解决。

来自主题: AI技术研报

7316 点击 2025-02-07 16:16

英伟达联手MIT清北发布SANA 1.5！线性扩散Transformer再刷文生图新SOTA

SANA 1.5是一种高效可扩展的线性扩散Transformer，针对文本生成图像任务进行了三项创新：高效的模型增长策略、深度剪枝和推理时扩展策略。这些创新不仅大幅降低了训练和推理成本，还在生成质量上达到了最先进的水平。

来自主题: AI技术研报

11775 点击 2025-02-07 16:05

ICLR 2025｜小米新一代Kaldi语音识别算法CR-CTC，纯CTC性能实现SOTA

新一代 Kaldi 团队是由 Kaldi 之父、IEEE fellow、小米集团首席语音科学家 Daniel Povey 领衔的团队，专注于开源语音基础引擎研发，从神经网络声学编码器、损失函数、优化器和解码器等各方面重构语音技术链路，旨在提高智能语音任务的准确率和效率。

来自主题: AI技术研报

7909 点击 2025-02-07 16:02