开源版AI虚拟主播来了,完全离线运行

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
开源版AI虚拟主播来了,完全离线运行
7960点击    2026-06-18 12:00

还记得那个火爆全球的 AI Vtuber neuro-sama 吗?一个能实时和观众互动的 AI 虚拟主播。


现在有人把它开源复刻了,而且所有功能都能在你自己的电脑上完全离线运行


开源版AI虚拟主播来了,完全离线运行


这是什么?


Open-LLM-VTuber 是一个开源的 AI 语音交互伴侣,目前 GitHub 上已有 1.1 万 Star


它把三件事合在了一起:


1. 大语言模型 —— 负责思考和对话


2. 语音识别 + 语音合成 —— 负责听和说


3. Live2D 虚拟形象 —— 负责视觉呈现


最终效果:你对着一个可爱的二次元角色说话,它会实时回复你,有表情、有动作,甚至你可以直接打断它——就像和真人对话一样自然。


开源版AI虚拟主播来了,完全离线运行


核心亮点


完全离线,隐私无忧


所有组件都可以本地运行:


LLM:Ollama 本地模型


语音识别:sherpa-onnx / FunASR / Whisper


语音合成:MeloTTS / GPTSoVITS / CosyVoice


不需要联网,不需要调 API,你的对话数据完全留在本地


跨平台支持


Windows ✅


macOS ✅(部分组件支持 GPU 加速)


Linux ✅


硬件方面,支持 NVIDIA GPU、非 NVIDIA GPU、纯 CPU 运行,或者直接调用云端 API。


开源版AI虚拟主播来了,完全离线运行


双端客户端


提供两种使用方式:


网页版:浏览器直接打开,简单方便


桌面端:支持窗口模式和桌宠模式(透明背景、全局置顶、鼠标穿透)


桌宠模式下,AI 角色就像一个小精灵一样浮在你的桌面上,随时可以聊几句。


高级交互功能


这是 Open-LLM-VTuber 最让人惊艳的部分:


开源版AI虚拟主播来了,完全离线运行


模型支持非常丰富


LLM(大脑)


Ollama、OpenAI(及兼容 API)、Gemini、Claude、Mistral、DeepSeek、vLLM……


基本上主流的大模型都支持。


ASR(耳朵)


sherpa-onnx、FunASR、Faster-Whisper、Whisper.cpp、Groq Whisper、Azure ASR……


TTS(嘴巴)


sherpa-onnx、MeloTTS、GPTSoVITS、CosyVoice、Edge TTS、Fish Audio、Azure TTS……


所有模块都可以通过 `conf.yaml` 配置文件无缝切换,不需要改代码。


开源版AI虚拟主播来了,完全离线运行


高度可定制


自定义 Live2D 模型:导入你喜欢的角色


自定义 Prompt:设定 AI 的性格和行为方式


声音克隆:通过 GPTSoVITS 实现声音克隆


自定义 Agent:支持集成 HumeAI EVI、Mem0 等自定义 Agent 架构


开源版AI虚拟主播来了,完全离线运行


上手难吗?


项目提供了详细的部署文档。基本流程:


1. 安装 `uv` 包管理器


2. 克隆项目并安装依赖


3. 编辑 `conf.yaml` 选择你要使用的模型


4. 启动服务,打开浏览器即可交互


v1.0.0 版本之后,更新也很方便:


uv run update.py


开源版AI虚拟主播来了,完全离线运行


这意味着什么?


Open-LLM-VTuber 的意义不只是复刻了 neuro-sama。它展示了一个趋势:


AI 伴侣正在从云端走向本地。


当所有组件都能离线运行时,AI 伴侣才真正属于你。不用担心隐私泄露,不用担心服务关闭,不用担心 API 涨价。


结合 Live2D 的视觉呈现和实时语音交互,这种体验已经非常接近「和一个虚拟角色真实对话」的感觉了。


对于想做 AI Vtuber、AI 助手、虚拟客服的开发者来说,这个项目是一个非常完整的参考实现。


开源版AI虚拟主播来了,完全离线运行


项目地址: https://github.com/Open-LLM-VTuber/Open-LLM-VTuber


官方网站: https://open-llm-vtuber.github.io/


许可证: 自定义开源许可


Star 数: 11,000+


文章来自于"留仙一码农",作者 "留仙一码农"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
声音克隆

【开源免费】MockingBird是一个5秒钟即可克隆你的声音的AI项目。

项目地址:https://github.com/babysor/MockingBird

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

4
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales