AI资讯新闻榜单内容搜索-部署

VLA 推理新范式！一致性模型 CEED-VLA 实现四倍加速！

近年来，视觉 - 语言 - 动作（Vision-Language-Action, VLA）模型因其出色的多模态理解与泛化能力，已成为机器人领域的重要研究方向。尽管相关技术取得了显著进展，但在实际部署中，尤其是在高频率和精细操作等任务中，VLA 模型仍受到推理速度瓶颈的严重制约。

来自主题: AI技术研报

6785 点击 2025-07-14 11:12

刚刚，首个通用型生物医学智能体Biomni开源！AI化身科学家，超越人类水平，震撼科研圈！

刚刚，全球首个通用生物医学AI智能体Biomni正式开源，相关代码及文件已经在Github发布，现已斩获超过700星，任何人都可以进行本地部署。

来自主题: AI资讯

7092 点击 2025-07-11 12:20

上交研究登Nature大子刊！可微分物理首次突破端到端无人机高速避障

上海交通大学研究团队提出了一种融合无人机物理建模与深度学习的端到端方法，该研究首次将可微分物理训练的策略成功部署到现实机器人中，实现了无人机集群自主导航，并在鲁棒性、机动性上大幅领先现有的方案。

来自主题: AI技术研报

7572 点击 2025-07-08 11:54

为什么 DeepSeek 大规模部署很便宜，本地很贵

为什么 DeepSeek-V3 据说在大规模服务时快速且便宜，但本地运行时却太慢且昂贵？为什么有些 AI 模型响应很慢，但一旦开始运行就变得很快？

来自主题: AI技术研报

8767 点击 2025-07-08 11:14

Diffusion约2倍无损加速！训练-推理协同的缓存学习框架来了｜ HKUST&北航&商汤

面对扩散模型推理速度慢、成本高的问题，HKUST&北航&商汤提出了全新缓存加速方案——HarmoniCa：训练-推理协同的特征缓存加速框架，突破DiT架构在部署端的速度瓶颈，成功实现高性能无损加速。

来自主题: AI技术研报

7655 点击 2025-07-06 15:05

vivo突破手机AI部署难题，绕开MoE架构限制，骁龙8 Elite流畅运行｜ICCV 2025

vivo AI研究院联合港中文以及上交团队为了攻克这些难题，从训练数据和模型结构两方面，系统性地分析了如何在MLLM训练中维持纯语言能力，并基于此提出了GenieBlue——专为移动端手机NPU设计的高效MLLM结构方案。

来自主题: AI技术研报

7406 点击 2025-07-05 13:12

本地LLM万字救场指南来了！全网超全AI实测：4卡狂飙70B大模型

AI非上云不可、非集群不能？万字实测告诉你，32B卡不卡？70B是不是智商税？要几张卡才能撑住业务？全网最全指南教你如何用最合适的配置，跑出最强性能。

来自主题: AI技术研报

7452 点击 2025-07-03 18:53

ChatGPT化身生活操作系统：奥特曼预告下一代顶级AI

OpenAI计划发布一个非常强大的开源模型。它能够让人们在本地运行极其强大的模型，重新认识“本地部署”的可能性。

来自主题: AI资讯

6283 点击 2025-06-30 16:03

从追缉本·拉登到AI战争，解密Palantir的崛起之路

Palantir是一家大数据AI公司，从军事起家如协助追缉本·拉登，扩展到商业和国防应用。核心产品包括Gotham情报分析、Foundry企业整合、AIP代理和Apollo部署，提供定制化服务以提升效率。在AI浪潮下股价大涨15倍，市盈率520倍。硅谷右翼崛起推动其定位为“国运股”，挑战传统估值逻辑。

来自主题: AI资讯

6904 点击 2025-06-30 11:59

腾讯混元推出首款开源混合推理模型：擅长Agent工具调用和长文理解

6 月 27 日，腾讯混元宣布开源首个混合推理 MoE 模型 Hunyuan-A13B，总参数 80B，激活参数仅 13B，效果比肩同等架构领先开源模型，但是推理速度更快，性价比更高。模型已经在 Github 和 Huggingface 等开源社区上线，同时模型 API 也在腾讯云官网正式上线，支持快速接入部署。

来自主题: AI资讯

7084 点击 2025-06-28 17:49