AI资讯新闻榜单内容搜索-部署

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 部署
从概念到生产级部署:AWS如何破解Agentic AI落地难题?

从概念到生产级部署:AWS如何破解Agentic AI落地难题?

从概念到生产级部署:AWS如何破解Agentic AI落地难题?

红杉美国合伙人 Konstantine Buhler 预测 2025 年将成为 AI agent 的“群体协作”时代,标志着 Agent 元年的到来。

来自主题: AI资讯
8300 点击    2025-07-18 14:02
「有望成为Transformer杀手」,谷歌DeepMind新架构MoR实现两倍推理速度

「有望成为Transformer杀手」,谷歌DeepMind新架构MoR实现两倍推理速度

「有望成为Transformer杀手」,谷歌DeepMind新架构MoR实现两倍推理速度

大型语言模型已展现出卓越的能力,但其部署仍面临巨大的计算与内存开销所带来的挑战。随着模型参数规模扩大至数千亿级别,训练和推理的成本变得高昂,阻碍了其在许多实际应用中的推广与落地。

来自主题: AI技术研报
5323 点击    2025-07-18 11:58
Kiro开放公测:AI编程谁都会,能帮你上线才叫AI IDE

Kiro开放公测:AI编程谁都会,能帮你上线才叫AI IDE

Kiro开放公测:AI编程谁都会,能帮你上线才叫AI IDE

你是不是也有过这样的经历:写了几个prompt,很快就构建出一个能运行的应用程序,感觉像变魔术一样。但当你真正想要将它部署到生产环境中时,却发现困难重重。而擅长Spec-Driven Development(以需求为导向的开发)的Kiro,就是这些问题的正解。

来自主题: AI资讯
8030 点击    2025-07-16 08:55
首次综述「边-云协同计算」,分布式智能与模型优化的最新进展

首次综述「边-云协同计算」,分布式智能与模型优化的最新进展

首次综述「边-云协同计算」,分布式智能与模型优化的最新进展

边缘-云协同计算通过整合边缘节点和云端资源,解决了传统云计算的延迟和带宽问题,推动了分布式智能和模型优化的发展。最新综述论文系统梳理了ECCC的架构设计、模型优化、资源管理、隐私安全和实际应用,提出了统一的分布式智能与模型优化框架,为未来研究提供了方向,包括大语言模型部署、6G整合和量子计算等前沿技术。

来自主题: AI技术研报
6847 点击    2025-07-15 11:43
VLA 推理新范式!一致性模型 CEED-VLA 实现四倍加速!

VLA 推理新范式!一致性模型 CEED-VLA 实现四倍加速!

VLA 推理新范式!一致性模型 CEED-VLA 实现四倍加速!

近年来,视觉 - 语言 - 动作(Vision-Language-Action, VLA)模型因其出色的多模态理解与泛化能力,已成为机器人领域的重要研究方向。尽管相关技术取得了显著进展,但在实际部署中,尤其是在高频率和精细操作等任务中,VLA 模型仍受到推理速度瓶颈的严重制约。

来自主题: AI技术研报
5828 点击    2025-07-14 11:12
刚刚,首个通用型生物医学智能体Biomni开源!AI化身科学家,超越人类水平,震撼科研圈!

刚刚,首个通用型生物医学智能体Biomni开源!AI化身科学家,超越人类水平,震撼科研圈!

刚刚,首个通用型生物医学智能体Biomni开源!AI化身科学家,超越人类水平,震撼科研圈!

刚刚,全球首个通用生物医学AI智能体Biomni正式开源,相关代码及文件已经在Github发布,现已斩获超过700星,任何人都可以进行本地部署。

来自主题: AI资讯
5892 点击    2025-07-11 12:20
上交研究登Nature大子刊!可微分物理首次突破端到端无人机高速避障

上交研究登Nature大子刊!可微分物理首次突破端到端无人机高速避障

上交研究登Nature大子刊!可微分物理首次突破端到端无人机高速避障

上海交通大学研究团队提出了一种融合无人机物理建模与深度学习的端到端方法,该研究首次将可微分物理训练的策略成功部署到现实机器人中,实现了无人机集群自主导航,并在鲁棒性、机动性上大幅领先现有的方案。

来自主题: AI技术研报
6520 点击    2025-07-08 11:54
为什么 DeepSeek 大规模部署很便宜,本地很贵

为什么 DeepSeek 大规模部署很便宜,本地很贵

为什么 DeepSeek 大规模部署很便宜,本地很贵

为什么 DeepSeek-V3 据说在大规模服务时快速且便宜,但本地运行时却太慢且昂贵?为什么有些 AI 模型响应很慢,但一旦开始运行就变得很快?

来自主题: AI技术研报
7176 点击    2025-07-08 11:14
Diffusion约2倍无损加速!训练-推理协同的缓存学习框架来了| HKUST&北航&商汤

Diffusion约2倍无损加速!训练-推理协同的缓存学习框架来了| HKUST&北航&商汤

Diffusion约2倍无损加速!训练-推理协同的缓存学习框架来了| HKUST&北航&商汤

面对扩散模型推理速度慢、成本高的问题,HKUST&北航&商汤提出了全新缓存加速方案——HarmoniCa:训练-推理协同的特征缓存加速框架,突破DiT架构在部署端的速度瓶颈,成功实现高性能无损加速。

来自主题: AI技术研报
6470 点击    2025-07-06 15:05
vivo突破手机AI部署难题,绕开MoE架构限制,骁龙8 Elite流畅运行|ICCV 2025

vivo突破手机AI部署难题,绕开MoE架构限制,骁龙8 Elite流畅运行|ICCV 2025

vivo突破手机AI部署难题,绕开MoE架构限制,骁龙8 Elite流畅运行|ICCV 2025

vivo AI研究院联合港中文以及上交团队为了攻克这些难题,从训练数据和模型结构两方面,系统性地分析了如何在MLLM训练中维持纯语言能力,并基于此提出了GenieBlue——专为移动端手机NPU设计的高效MLLM结构方案。

来自主题: AI技术研报
5867 点击    2025-07-05 13:12