AI资讯新闻榜单内容搜索-Deepseek-v

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Deepseek-v
刚刚,阿里首个超万亿参数新王登基!Qwen3-Max屠榜全SOTA,碾压DeepSeek V3.1

刚刚,阿里首个超万亿参数新王登基!Qwen3-Max屠榜全SOTA,碾压DeepSeek V3.1

刚刚,阿里首个超万亿参数新王登基!Qwen3-Max屠榜全SOTA,碾压DeepSeek V3.1

阿里迄今为止,参数最大的模型诞生了!昨夜,Qwen3-Max-Preview(Instruct)官宣上线,超1万亿参数性能爆表。在全球主流权威基准测试中,Qwen3-Max-Preview狂揽非推理模型「C」位,直接碾压Claude-Opus 4(Non-Thinking)、Kimi-K2、DeepSeek-V3.1。

来自主题: AI资讯
8574 点击    2025-09-06 10:16
DeepSeek、GPT-5都在尝试的快慢思考切换,有了更智能版本,还是多模态

DeepSeek、GPT-5都在尝试的快慢思考切换,有了更智能版本,还是多模态

DeepSeek、GPT-5都在尝试的快慢思考切换,有了更智能版本,还是多模态

当前,业界顶尖的大模型正竞相挑战“过度思考”的难题,即无论问题简单与否,它们都采用 “always-on thinking” 的详细推理模式。无论是像 DeepSeek-V3.1 这种依赖混合推理架构提供需用户“手动”介入的快慢思考切换,还是如 GPT-5 那样通过依赖庞大而高成本的“专家路由”机制提供的自适应思考切换。

来自主题: AI技术研报
5023 点击    2025-09-02 12:27
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1

王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1

王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1

没想到啊,最新SOTA的开源大模型…… 来自一个送外卖(Waimai)的——有两个AI,确实不一样。 这个最新开源模型叫:Longcat-Flash-Chat,美团第一个开源大模型,发布即开源,已经在海内外的技术圈子里火爆热议了。

来自主题: AI资讯
7079 点击    2025-09-01 15:12
热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?

热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?

热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?

上周三,DeepSeek 开源了新的基础模型,但不是万众期待的 V4,而是 V3.1-Base,而更早时候,DeepSeek-V3.1 就已经上线了其网页、App 端和小程序。

来自主题: AI资讯
6309 点击    2025-08-26 19:44
大模型价格战逆转?深扒17家厂商最新定价,竟有超7成在涨价

大模型价格战逆转?深扒17家厂商最新定价,竟有超7成在涨价

大模型价格战逆转?深扒17家厂商最新定价,竟有超7成在涨价

DeepSeek涨价了。 智东西8月23日报道,8月21日,DeepSeek在其公众号官宣了DeepSeek-V3.1的正式发布,还宣布自9月6日起,DeepSeek将执行新价格表,取消了今年2月底推出的夜间优惠,推理与非推理API统一定价,输出价格调整至12元/百万tokens。这一决定,让使用DeepSeek API的最低价格较过去上升了50%。

来自主题: AI资讯
7200 点击    2025-08-25 12:29
手把手:1分钟把 Claude Code 迁到 DeepSeek V3.1,开箱即干

手把手:1分钟把 Claude Code 迁到 DeepSeek V3.1,开箱即干

手把手:1分钟把 Claude Code 迁到 DeepSeek V3.1,开箱即干

今天下午,DeepSeek 官方正式发布 DeepSeek-V3.1。相比于前天只在用户群里通知,今天新增了模型升级点、榜单成绩、model card,huggingface 上现在也可以下载模型文件了。

来自主题: AI资讯
5936 点击    2025-08-22 18:13
DeepSeek-V3.1震撼发布,全球开源编程登顶!R1/V3首度合体,训练量暴增10倍

DeepSeek-V3.1震撼发布,全球开源编程登顶!R1/V3首度合体,训练量暴增10倍

DeepSeek-V3.1震撼发布,全球开源编程登顶!R1/V3首度合体,训练量暴增10倍

DeepSeek-V3.1官宣了,作为首款「混合推理」模型,将开启智能体新时代。新模型共有671B参数,编码实力碾压DeepSeek-R1、Claude 4 Opus,登顶编程开源第一。

来自主题: AI资讯
6747 点击    2025-08-22 11:52
硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

自首次提出 GPT 架构以来,转眼已经过去了七年。 如果从 2019 年的 GPT-2 出发,回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4,不难发现一个有趣的现象:尽管模型能力不断提升,但其整体架构在这七年中保持了高度一致。

来自主题: AI技术研报
6461 点击    2025-08-08 11:52