官网介绍
GPT-vup 是一款支持BiliBili和抖音平台的AI虚拟主播工具,基于生产者-消费者模型设计,整合了OpenAI嵌入技术与GPT3.5 API能力。该项目由开发者jiran214创建,目前已获得1.3k星标和186次分支。请注意,本库已停止维护,开发者推荐关注其新项目Langup(https://github.com/jiran214/langup-ai),该项目已实现直播数字人功能。
核心功能特点
基础互动功能
提供虚拟主播的核心互动能力,包括智能回答弹幕和SC消息、自动欢迎入场观众以及感谢礼物等基础直播互动功能。
语音交互插件
通过语音识别技术实现实时语音交互,用户按住Ctrl+T热键即可说话,系统自动将语音转为文本与AI数字人进行交互。需安装pyaudio、speech_recognition和keyboard依赖库。
动作表情系统
实现虚拟主播根据观众互动行为匹配相应动作表情的功能。通过PyVTS库与Vtube Studio软件对接,可自动生成动作配置文件action.json,支持动作表情的动态更新。
定时任务机制
支持设置定时触发事件,如定时讲故事、唱rap等内容输出。用户可在utils/prompt_temple.py的schedule_task_temple_list列表中自定义触发事件内容。
上下文增强(实验功能)
作为实验性功能,提供对话上下文补充能力,需依赖Docker环境下的Milvus 2.0向量数据库和MySQL数据库支持,实现对话历史的高效存储与检索。
应用场景
- B站直播:通过bilibili-api-python库实现B站平台的虚拟主播直播,支持房间号自定义配置
- 抖音直播:结合抖音弹幕抓取数据推送程序,实现抖音平台的虚拟主播互动
- 虚拟偶像运营:通过自定义system_template设置虚拟主播的初始人设,打造独特的虚拟偶像形象
- 语音互动直播:适合需要双手操作游戏或其他内容同时进行语音互动的直播场景
- 自动化内容生成:利用定时任务插件实现周期性内容输出,减轻主播内容创作压力
- 智能客服直播:可应用于产品展示、在线咨询等商业直播场景,提供7x24小时智能服务
优势
GPT-vup的主要优势在于跨平台支持与模块化设计,同时兼容BiliBili和抖音两大主流直播平台。项目采用插件化架构,核心功能与扩展功能分离,默认关闭插件机制确保基础功能的轻量运行。通过与Vtube Studio的深度整合,实现了高质量的2D虚拟形象展示与动作同步。此外,系统支持高度自定义,用户可通过修改prompt模板文件调整虚拟主播的人设与行为模式,满足个性化需求。
价值总结
GPT-vup为内容创作者提供了低成本进入虚拟主播领域的解决方案,无需专业动画制作知识即可快速部署具备AI交互能力的虚拟主播。通过自动化处理重复性互动工作,显著降低了直播运营的人力成本,同时AI驱动的智能交互提升了观众参与感与直播趣味性。项目的开源特性允许开发者根据自身需求进行二次开发,扩展更多定制化功能,为虚拟主播技术的创新应用提供了基础平台。
用户体验与优势
工具设计注重用户体验,提供简洁的配置流程和清晰的操作指引。麦克风设置上支持直接使用系统默认输出设备,无需复杂的虚拟声道配置即可实现嘴型同步。动作表情系统支持直观的命名机制,便于用户管理和调用。项目提供详细的安装步骤和问题解决方案,降低了技术门槛。通过热键操作设计,语音交互功能实现了便捷的双手不离键盘操作模式,提升了直播效率。
技术优势
GPT-vup采用Python语言开发,基于生产者-消费者模型实现高效的消息处理机制。技术架构上采用目录重构设计,解决了依赖混乱问题,提升了代码可维护性。系统整合了多种先进技术,包括OpenAI的嵌入技术、GPT3.5的自然语言处理能力、Milvus向量数据库的相似度检索以及MySQL的数据持久化存储。V2.0版本实现了更清晰的代码组织结构和更简单的文档说明,同时引入了上下文插件,增强了AI对话的连贯性和智能度。项目还提供了完整的API对接方案,与Vtube Studio等专业虚拟形象软件实现无缝集成。




京公网安备 京ICP备17006096号-3