AI资讯新闻榜单内容搜索-部署

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 部署
清华开源混合精度推理系统MixQ,实现大模型近无损量化并提升推理吞吐

清华开源混合精度推理系统MixQ,实现大模型近无损量化并提升推理吞吐

清华开源混合精度推理系统MixQ,实现大模型近无损量化并提升推理吞吐

一键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍! 清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。 MixQ支持8比特和4比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。

来自主题: AI资讯
4275 点击    2024-10-21 14:15
大模型引领6G革命!最新综述探索「未来通信方式」:九大方向,覆盖多模态、RAG等

大模型引领6G革命!最新综述探索「未来通信方式」:九大方向,覆盖多模态、RAG等

大模型引领6G革命!最新综述探索「未来通信方式」:九大方向,覆盖多模态、RAG等

大语言模型(LLM)正在推动通信行业向智能化转型,在自动生成网络配置、优化网络管理和预测网络流量等方面展现出巨大潜力。未来,LLM在电信领域的应用将需要克服数据集构建、模型部署和提示工程等挑战,并探索多模态集成、增强机器学习算法和经济高效的模型压缩技术。

来自主题: AI技术研报
5108 点击    2024-10-18 13:40
全球首台Arm超算光荣退役!下一代已接任,配备384块英伟达Grace CPU

全球首台Arm超算光荣退役!下一代已接任,配备384块英伟达Grace CPU

全球首台Arm超算光荣退役!下一代已接任,配备384块英伟达Grace CPU

世界上首台基于Arm架构的超算,现如今终于退役了。 2018年5月,这台拥有10000个核心的系统Isambard 2首次部署。 它使用了由Cavium开发、台积电制造的64位Armv8 ThunderX2处理器,外加几个Nvidia P100 GPU。

来自主题: AI资讯
5743 点击    2024-10-05 12:28
给机器人装上「虫脑」?非Transformer液态神经网络终于来了!MIT CSAIL负责人创业成果

给机器人装上「虫脑」?非Transformer液态神经网络终于来了!MIT CSAIL负责人创业成果

给机器人装上「虫脑」?非Transformer液态神经网络终于来了!MIT CSAIL负责人创业成果

一个受线虫启发的全新架构,三大「杯型」均能实现 SOTA 性能,资源高度受限环境也能部署。移动机器人可能更需要一个虫子的大脑。

来自主题: AI技术研报
8654 点击    2024-10-01 14:10
图像AI那么耗算力,问题出在 RGB 格式上?

图像AI那么耗算力,问题出在 RGB 格式上?

图像AI那么耗算力,问题出在 RGB 格式上?

最近一直在想一个问题。为什么我们的图像 AI 模型那么耗算力?比如,现在多模态图文理解 AI 模型本地化部署一个节点,动不动就需要十几个 G 的显存资源。

来自主题: AI资讯
2739 点击    2024-09-18 15:49
告诉 Replit 的 AI 代理您的应用想法,它将为您编码和部署

告诉 Replit 的 AI 代理您的应用想法,它将为您编码和部署

告诉 Replit 的 AI 代理您的应用想法,它将为您编码和部署

Replit 推出了一款能够从头开始构建整个应用程序的AI 代理。这不仅仅是另一个副驾驶编码助手——它更接近于实习软件开发人员,能够理解你的愿景并帮助实现它。

来自主题: AI资讯
7034 点击    2024-09-10 16:01
「帆软」发布商业分析产品FineChatBl,提供更高效分析解决方案丨最前线

「帆软」发布商业分析产品FineChatBl,提供更高效分析解决方案丨最前线

「帆软」发布商业分析产品FineChatBl,提供更高效分析解决方案丨最前线

在此之上,「帆软」将FineChatBI的核心能力集成开放给部分优质客户,让用户依托平台,能够独立部署企业数据库,完善企业底层数据资产建设。

来自主题: AI资讯
5690 点击    2024-09-10 14:21
Unstructured.io:让企业非结构化数据 LLM-Ready

Unstructured.io:让企业非结构化数据 LLM-Ready

Unstructured.io:让企业非结构化数据 LLM-Ready

企业要用好 LLM 离不开高质量数据。和传统机器学习模型相比,LLM 对于数据需求量更大、要求更高,尤其是非结构化数据。而传统 ETL 工具并不擅长非结构化数据的处理,因此,企业在部署 LLM 的过程中,数据科学家们往往要耗费大量的时间精力在数据处理环节。这一环节既关系到 LLM 部署的效率和质量,也对数据科学家人力的 ROI 产生影响。

来自主题: AI资讯
10937 点击    2024-09-05 10:02