AI资讯新闻榜单内容搜索-deepseek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: deepseek
企业把AI用起来,真的不是接入个DeepSeek就完事了

企业把AI用起来,真的不是接入个DeepSeek就完事了

企业把AI用起来,真的不是接入个DeepSeek就完事了

一个残酷的事实—— 企业内部跟上AI时代,真的不是选个模型来让大家用就完事了。

来自主题: AI资讯
7787 点击    2025-05-21 14:56
华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

要问最近哪个模型最火,混合专家模型(MoE,Mixture of Experts)绝对是榜上提名的那一个。

来自主题: AI技术研报
8009 点击    2025-05-20 15:16
可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究,说当前最先进的LLM在多轮对话中表现会大幅下降,平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型(包括Claude 3.7-Sonnet、Deepseek-R1等)在多轮对话中的表现差异,还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报
6957 点击    2025-05-20 10:16
北大DeepSeek论文或预定ACL Best Paper!梁文锋署名

北大DeepSeek论文或预定ACL Best Paper!梁文锋署名

北大DeepSeek论文或预定ACL Best Paper!梁文锋署名

北大DeepSeek联合发布的NSA论文,目前已被ACL 2025录用并获得了极高评分,甚至有望冲击最佳论文奖。该技术颠覆传统注意力机制,实现算力效率飞跃,被誉为长文本处理的革命性突破。

来自主题: AI资讯
7955 点击    2025-05-19 17:19
华为+DeepSeek,推理性能创新高!技术报告也公布出来了

华为+DeepSeek,推理性能创新高!技术报告也公布出来了

华为+DeepSeek,推理性能创新高!技术报告也公布出来了

部署超大规模MoE这件事,国产芯片的推理性能,已经再创新高了—— 不仅是“英伟达含量为0”这么简单,更是性能全面超越英伟达Hopper架构!

来自主题: AI技术研报
8940 点击    2025-05-19 16:37
中国 AI 大厂,被 Deepseek 掀了牌桌之后

中国 AI 大厂,被 Deepseek 掀了牌桌之后

中国 AI 大厂,被 Deepseek 掀了牌桌之后

当技术范式重构,强者也不得不重新起跑。

来自主题: AI资讯
6741 点击    2025-05-19 14:58
换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

每次更换语言模型就要重新优化提示词?资源浪费且效率低下!本文介绍MetaSPO框架,首个专注模型迁移系统提示优化的元学习方法,让一次优化的提示可跨模型通用。我在儿童教育场景的实验验证了效果:框架自动生成了五种不同教育范式的系统提示,最优的"苏格拉底式"提示成功由DeepSeek-V3迁移到通义千问模型,评分从0.3920提升至0.4362。

来自主题: AI技术研报
5792 点击    2025-05-19 10:11
被低估的ChatGPT新功能,10分钟搞定DeepSeek代码库深度研究

被低估的ChatGPT新功能,10分钟搞定DeepSeek代码库深度研究

被低估的ChatGPT新功能,10分钟搞定DeepSeek代码库深度研究

ChatGPT悄悄上线的直连Github新功能太强大!一旦连上Github,立马化身「研究怪兽」:不管是DeepSeek这样的明星开源项目,还是自己DIY的文档资料,只要放进仓库,就能交给深度研究,一键生成专业到飞起的报告。

来自主题: AI产品测评
8030 点击    2025-05-18 15:05