AI资讯新闻榜单内容搜索-DeepSeeK

速递｜日本AI独角兽Sakana AI，以26.5亿美元估值完成1.35亿美元B轮融资

当美国巨头如Google、OpenAI 和 Anthropic 竞相开发支撑其 AI 产品的大型语言模型时，Sakana AI、Mistral AI、DeepSeek 和 AI21 Labs 等初创公司正凭借为特定地区、行业或独特功能设计的专业模型开辟自己的细分市场。

来自主题: AI资讯

10373 点击 2025-11-18 16:35

啊？微博7800美元训的大模型，数学能力超了DeepSeek-R1

近日，微博正式发布首个自研开源大模型VibeThinker，这个仅拥有15亿参数的“轻量级选手”，在国际顶级数学竞赛基准测试上击败了参数量是其数百倍的、高达6710亿的DeepSeek R1模型。

来自主题: AI资讯

8840 点击 2025-11-18 16:34

当AI重新定义「科研影响力」：一场关于CSRankings的反思与重塑

在计算机科学领域， CSRankings 曾被视为一次划时代的改进。它摒弃了早期诸如 USNews 那样依赖调查问卷的主观排名体系，转而以论文发表数量这一客观指标来评估各大学的科研实力。

来自主题: AI资讯

8040 点击 2025-11-15 17:08

梁文锋代表DeepSeek，他代表梁文锋

浙江乌镇的世界互联网大会上，备受瞩目的「杭州六小龙」首次同台亮相。阿里云创始人王坚院士亲自主持，宇树创始人及CEO王兴兴、强脑科技创始人及CEO韩璧丞、群核科技创始人及董事长黄晓煌、游戏科学创始人及CEO、《黑神话：悟空》制作人冯骥、云深处科技创始人及CEO朱秋国……悉数落座。

来自主题: AI资讯

7021 点击 2025-11-15 10:16

罗福莉C位亮相小米，离职DeepSeek后首次官宣

就在今天，罗福莉以C位之姿，首次对外官宣了小米任职。刚刚，罗福莉在X上高调宣布——正式加入小米，出任MiMo团队负责人。智能的进化必然会从语言世界走向物理世界，解锁多模态的空间智能——具备感知、推理、生成与行动的能力，这是实现真正通用人工智能（AGI）的关键一步。

来自主题: AI资讯

9161 点击 2025-11-12 19:07

AI编程冲刺“DeepSeek时刻”：00后团队用国产模型一键直出复杂应用，效果超越Claude Code

这一次带来如此新SOTA效果的，是全球首个实现项目级开发的AI IDE——Vinsoo。刚刚，Vinsoo上新Beta 3.0版本，仅用国产大模型（Qwen），就超越了搭载Claude的Cursor、Codex、Claude Code等一众流行AI编程产品。Vinsoo是芸思智能推出的全球首个搭载云端安全Agent编程团队的AI IDE，主打从需求确认到交付验收，AI全流程自动推进项目开发。

来自主题: AI资讯

10852 点击 2025-11-10 16:48

与DeepSeek-OCR不谋而合，NeurIPS论文提出让LLM像人一样读长文本

在处理短文本时，大语言模型（LLM）已经表现出惊人的理解和生成能力。但现实世界中的许多任务 —— 如长文档理解、复杂问答、检索增强生成（RAG）等 —— 都需要模型处理成千上万甚至几十万长度的上下文。

来自主题: AI技术研报

7371 点击 2025-11-10 15:12

小成本DeepSeek和Kimi，正攻破奥特曼的「算力护城河」

2025年前盛行的闭源+重资本范式正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写，二者以数百万美元成本、开源权重，凭MoE与MuonClip等优化，在SWE-Bench与BrowseComp等基准追平或超越GPT-5，并以更低API价格与本地部署撬动市场预期，促使行业从砸钱堆料转向以架构创新与稳定训练为核心的高效路线。

来自主题: AI资讯

10721 点击 2025-11-10 09:19

英伟达、DeepSeek集体跟进！18个月前被忽视，如今统治AI推理

2024年，加州大学圣地亚哥分校「Hao AI Lab」提出了DistServe的解耦推理理念，短短一年多时间，迅速从实验室概念成长为行业标准，被NVIDIA、vLLM等主流大模型推理框架采用，预示着AI正迈向「模块化智能」的新时代。

来自主题: AI技术研报

11288 点击 2025-11-09 15:37

两周复刻DeepSeek-OCR！两人小团队还原低token高压缩核心，换完解码器更实用

两人小团队，仅用两周就复刻了之前被硅谷夸疯的DeepSeek-OCR？？复刻版名叫DeepOCR，还原了原版低token高压缩的核心优势，还在关键任务上追上了原版的表现。完全开源，而且无需依赖大规模的算力集群，在两张H200上就能完成训练。

来自主题: AI资讯

9200 点击 2025-11-07 15:22