一种基于安卓系统部署的大语言模型快速推理方法和系统
申请号:CN202511323632
申请日期:2025-09-17
公开号:CN120821515B
公开日期:2025-12-26
类型:发明专利
摘要
本发明公开了一种基于安卓系统部署的大语言模型快速推理方法和系统,包括:在PC端中构建OpenGL环境,并在OpenGL环境中克隆大语言模型推理框架,并在OpenGL环境中选择GPU硬件加速,将大语言模型推理框架和硬件加速编译转换后得到so文件;获取大语言模型资源文件,并将大语言模型资源文件转换量化为GGUF格式文件;利用安卓开发组件准备安卓NDK环境,并在安卓NDK环境中将大语言模型的GGUF格式文件转换为LLM.so文件,并在安卓NDK环境中配置动态库链接;创建安卓NDK项目,在安卓NDK项目中配置大语言模型推理的GPU调用指令,启动大语言模型推理,在对应PC端的CPU中运行。
技术关键词
大语言模型
安卓系统
推理方法
配置动态库
集成开发工具
项目创建方法
命令行工具
生成可执行
指令
框架方法
接口
处理器
推理系统
可读存储介质
转换方法
资源
安装工具
生成方法