AI资讯新闻榜单内容搜索-部署

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 部署
2026最佳AI工具推荐,让你一整年效率拉满!(推荐收藏)

2026最佳AI工具推荐,让你一整年效率拉满!(推荐收藏)

2026最佳AI工具推荐,让你一整年效率拉满!(推荐收藏)

大家好,我是袋鼠帝 在过去的2年里,我为了写教程,也为了让AI帮我躺平,前前后后试了上百种AI工具,有免费的,有付费的,有本地部署的。 有些工具很棒,有些一言难尽,甚至有些已经不在了 最近几天我把这2

来自主题: AI资讯
8738 点击    2026-01-03 13:58
微信炼出扩散语言模型,实现vLLM部署AR模型3倍加速,低熵场景超10倍

微信炼出扩散语言模型,实现vLLM部署AR模型3倍加速,低熵场景超10倍

微信炼出扩散语言模型,实现vLLM部署AR模型3倍加速,低熵场景超10倍

近日,腾讯微信 AI 团队提出了 WeDLM(WeChat Diffusion Language Model),这是首个在工业级推理引擎(vLLM)优化条件下,推理速度超越同等 AR 模型的扩散语言模型。

来自主题: AI技术研报
9353 点击    2026-01-03 13:56
7B扩散语言模型单样例1000+ tokens/s!上交大联合华为推出LoPA

7B扩散语言模型单样例1000+ tokens/s!上交大联合华为推出LoPA

7B扩散语言模型单样例1000+ tokens/s!上交大联合华为推出LoPA

,时长 00:20 视频 1:单样例推理速度对比:SGLang 部署的 Qwen3-8B (NVIDIA) vs. LoPA-Dist 部署 (NVIDIA & Ascend)(注:NVIDIA 平台

来自主题: AI技术研报
7745 点击    2026-01-01 10:09
拖拽式搭建分布式Agent工作流!Maze让非技术人员几分钟搞定复杂任务

拖拽式搭建分布式Agent工作流!Maze让非技术人员几分钟搞定复杂任务

拖拽式搭建分布式Agent工作流!Maze让非技术人员几分钟搞定复杂任务

在大模型智能体(LLM Agent)落地过程中,复杂工作流的高效执行、资源冲突、跨框架兼容、分布式部署等问题一直困扰着开发者。而一款名为Maze的分布式智能体工作流框架,正以任务级精细化管理、智能资源调度、多场景部署支持等核心优势,为这些痛点提供一站式解决方案。

来自主题: AI资讯
8254 点击    2025-12-30 15:14
无限代码危机!奈飞AI工程师曝自家上下文工程秘诀:三阶段方法论!AI不能理解软件为什么会失败!每一代工程师都会撞上一堵墙!

无限代码危机!奈飞AI工程师曝自家上下文工程秘诀:三阶段方法论!AI不能理解软件为什么会失败!每一代工程师都会撞上一堵墙!

无限代码危机!奈飞AI工程师曝自家上下文工程秘诀:三阶段方法论!AI不能理解软件为什么会失败!每一代工程师都会撞上一堵墙!

在一场技术演讲中,Netflix 工程部的资深大牛 Jake Nations,开场就抛出了一个几乎所有工程师都心照不宣的“坦白”。几乎每个正在使用 Copilot、Cursor、Claude 写代码的人,都干过同一件事:让 AI 生成代码,看起来没问题,就直接交付。测试通过、功能可用、部署成功,但当系统真的在凌晨三点出问题时,没人能再说清楚它为什么还能跑。

来自主题: AI资讯
7643 点击    2025-12-28 09:54
50万个AI生成的应用,正在赚钱

50万个AI生成的应用,正在赚钱

50万个AI生成的应用,正在赚钱

用零手写代码、零成本、零部署压力的“三无”AI生成应用,把Prompt换成真金白银的第一批“野生开发者”已经出现了。

来自主题: AI资讯
6232 点击    2025-12-17 15:21
NeurIPS 2025 | 英伟达发布Nemotron-Flash:以GPU延迟为核心重塑小模型架构

NeurIPS 2025 | 英伟达发布Nemotron-Flash:以GPU延迟为核心重塑小模型架构

NeurIPS 2025 | 英伟达发布Nemotron-Flash:以GPU延迟为核心重塑小模型架构

导读 过去两年,小语言模型(SLM)在业界备受关注:参数更少、结构更轻,理应在真实部署中 “更快”。但只要真正把它们跑在 GPU 上,结论往往令人意外 —— 小模型其实没有想象中那么快。

来自主题: AI技术研报
7792 点击    2025-12-01 10:09
告别GUI Agent工程基建噩梦:阶跃开源4B Agent模型,跑通所有安卓设备,手搓党一键部署

告别GUI Agent工程基建噩梦:阶跃开源4B Agent模型,跑通所有安卓设备,手搓党一键部署

告别GUI Agent工程基建噩梦:阶跃开源4B Agent模型,跑通所有安卓设备,手搓党一键部署

首次将GUI Agent模型与完整配套基建同步开放,支持手搓党一键部署!这就是阶跃星辰刚刚开源的GELab-Zero。其中4B版本的GUI Agent模型在手机端、电脑端等多个GUI榜单上全面刷新同尺寸模型性能纪录,取得SOTA成绩。

来自主题: AI资讯
8599 点击    2025-11-30 15:12
NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路

NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路

NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路

大模型推理的爆发,实际源于 scaling 范式的转变:从 train-time scaling 到 test-time scaling(TTS),即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法:通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗?

来自主题: AI技术研报
7986 点击    2025-11-30 09:30