一种基于边缘计算的大语言模型优化方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于边缘计算的大语言模型优化方法
申请号:
CN202411525003
申请日期:
2024-10-30
公开号:
CN119026640A
公开日期:
2024-11-26
类型:
发明专利
摘要
本发明公开了一种基于边缘计算的大语言模型优化方法,属于机器学习领域,本发明在边缘计算的环境中,基于Transformer的大模型结构框架下,通过找寻模型推理的最佳分割点,从而将Transformer模型分割成底层部分和高层部分,在算力受限的用户设备上部署轻量化的底层模型,将计算密集型的高层模型部署在云端服务器上;通过找寻最优分割点,将Transformer模型在用户设备和云服务器上进行合理分割部署,从而实现计算资源利用的优化和响应延迟的降低。
技术关键词
语言模型优化方法
云端服务器
边缘计算环境
瑞利衰落信道
动态资源分配
蒙特卡罗树搜索
节点
策略
资源预留
结构框架
时间段
网络
决策
噪声
参数
结点
受限
系统为您推荐了相关专利信息
1
一种基于ARM架构和XC架构的虚拟化浏览器
虚拟浏览器
虚拟资源管理器
管理平台模块
操作系统模块
沙箱
2
基于持续知识蒸馏和联邦学习的物联网设备数据聚合方法
节点
联网设备
数据
蒸馏
教师
3
一种基于数据中台的卫片执法统计分析方法
统计分析方法
分布式数据库集群
海量多源异构
数据治理技术
统计分析模型
4
一种车辆车窗自动控制方法、系统、车辆、介质和产品
场景
自动控制方法
车辆车窗
地理位置信息
车辆地理位置
5
一种基于人脸人体重识别的中长跑评测方法及系统
人体重识别
压力传感垫
评测方法
终端模块
主成分分析算法