一种基于边缘计算的大语言模型优化方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于边缘计算的大语言模型优化方法
申请号:CN202411525003
申请日期:2024-10-30
公开号:CN119026640A
公开日期:2024-11-26
类型:发明专利
摘要
本发明公开了一种基于边缘计算的大语言模型优化方法,属于机器学习领域,本发明在边缘计算的环境中,基于Transformer的大模型结构框架下,通过找寻模型推理的最佳分割点,从而将Transformer模型分割成底层部分和高层部分,在算力受限的用户设备上部署轻量化的底层模型,将计算密集型的高层模型部署在云端服务器上;通过找寻最优分割点,将Transformer模型在用户设备和云服务器上进行合理分割部署,从而实现计算资源利用的优化和响应延迟的降低。
技术关键词
语言模型优化方法 云端服务器 边缘计算环境 瑞利衰落信道 动态资源分配 蒙特卡罗树搜索 节点 策略 资源预留 结构框架 时间段 网络 决策 噪声 参数 结点 受限
系统为您推荐了相关专利信息
虚拟浏览器 虚拟资源管理器 管理平台模块 操作系统模块 沙箱
统计分析方法 分布式数据库集群 海量多源异构 数据治理技术 统计分析模型
场景 自动控制方法 车辆车窗 地理位置信息 车辆地理位置
人体重识别 压力传感垫 评测方法 终端模块 主成分分析算法