官网介绍
midjourney-proxy 是一个开源工具,主要功能是代理 MidJourney 的 Discord 频道,将其绘图能力通过 API 形式开放,实现程序化调用 AI 绘图。该工具支持 MidJourney 的核心绘图指令及相关功能,包括 Imagine 生成图像、垫图、图片混合(Blend)、图生文(Describe)等,并提供任务实时进度反馈、多账号管理、中文提示词翻译等增强功能。此外,还提供 midjourney-proxy-plus 版本,在开源版基础上扩展了更多高级功能,如焦点移动(Pan)、图片变焦(Zoom)、局部重绘(Vary Region)、Seed 值获取等,满足更复杂的绘图需求。项目支持多种部署方式,包括 Docker、Railway、Zeabur 等,同时提供详细的配置文档和 API 接口说明,方便开发者快速集成。
核心功能特点
基础绘图指令支持
全面支持 MidJourney 的核心绘图指令,包括 Imagine 生成图像及相关动作(如 Upscale、Variation 等),同时支持 Blend(图片混合)、Describe(图生文)等辅助指令,覆盖从文本生成图像到图像二次处理的完整流程。
垫图与多模态输入
在 Imagine 指令中支持添加图片 Base64 编码作为垫图,实现以图生图的创作方式;同时支持图片混合(Blend)功能,可将多张图片融合生成新图像,满足多模态创作需求。
实时任务进度与反馈
提供任务实时进度跟踪功能,用户可实时获取绘图任务的状态(如生成中、完成、失败等),并通过 user-token 连接 WSS(WebSocket Secure)获取详细错误信息和完整功能支持,提升开发调试效率。
多账号管理与任务队列
支持多账号配置,每个账号可独立设置任务队列,实现任务负载均衡和优先级管理。同时支持账号池持久化与动态维护,确保高并发场景下的稳定性,适合需要大规模调用的业务场景。
本地化与安全增强
内置中文 Prompt 翻译功能,可通过配置百度翻译或 GPT 实现中文提示词自动转换为英文;支持 Prompt 敏感词预检测机制,可自定义敏感词规则,降低违规风险;同时支持账号 Settings 配置,灵活适配不同使用需求。
丰富的部署与扩展选项
提供多样化部署方式,包括 Docker 容器化部署、Railway/Zeabur 平台一键部署(无需自建服务器)及本地开发部署(基于 Java 17 和 Maven),满足不同用户的环境需求。此外,midjourney-proxy-plus 版本还支持 Shorten(Prompt 分析)、焦点移动、局部重绘等高级功能,扩展性强。
应用场景
- 开发者集成 AI 绘图能力:第三方应用开发者可通过 API 将 MidJourney 绘图功能集成到自有应用(如设计工具、内容创作平台、社交 APP 等),无需直接对接 Discord,降低开发门槛。
- 自动化内容创作工具:内容创作者可结合该工具构建自动化工作流,例如通过脚本批量生成图片、根据用户输入动态生成配图,提升创作效率。
- 多账号管理平台:企业或团队可通过多账号配置功能,集中管理多个 MidJourney 账号,实现任务分流与负载均衡,避免单账号限流或任务积压。
- 教育与研究场景:教育机构或研究人员可利用该工具简化 AI 绘图调用流程,用于教学演示、艺术创作研究或 AI 生成效果分析等。
- 设计辅助工具:设计师可通过垫图(Base64 输入)、Blend 混合等功能,快速基于参考图生成创意草图,或通过 Describe 图生文功能获取图像描述,辅助设计思路拓展。
- 跨境业务支持:通过中文 Prompt 翻译功能,支持中文用户直接使用母语输入提示词,降低跨境创作的语言障碍,适合面向中文用户的应用场景。
- 视频生成与处理:midjourney-proxy-plus 版本支持视频生成相关接口,可用于短视频平台的内容自动化生成,或结合其他工具实现视频素材的批量创作。
优势
midjourney-proxy 的核心优势在于将 MidJourney 的 Discord 交互模式转化为标准化 API,大幅降低了集成门槛,使开发者无需熟悉 Discord 协议即可快速调用 AI 绘图能力。其多账号配置与任务队列机制,解决了单账号调用限制问题,提升了大规模使用的稳定性。功能覆盖全面,支持从基础绘图到高级编辑(如局部重绘、焦点移动)的全流程需求,并通过敏感词检测、中文翻译等本地化功能增强实用性。此外,多样化的部署方式(容器化、平台一键部署等)适配不同用户场景,开源版本免费可用,plus 版本提供更多高级功能,兼顾灵活性与扩展性。
价值总结
该工具的核心价值在于“连接”与“简化”:连接 MidJourney 的强大绘图能力与第三方应用,简化 API 调用流程,降低技术门槛;同时通过多账号管理、实时进度反馈、安全机制等功能,提升创作效率与使用安全性。无论是个人开发者、企业团队还是内容创作者,均可通过该工具快速构建 AI 绘图相关应用,拓展业务场景,实现创意与技术的高效结合。
用户体验与优势
用户使用 midjourney-proxy 时,可获得清晰的任务进度反馈,实时掌握绘图状态,避免盲目等待;中文 Prompt 翻译功能支持母语输入,降低语言障碍,提升操作流畅性;多账号管理界面(plus 版本内嵌管理后台)支持动态配置,无需手动修改配置文件,操作便捷。此外,user-token 连接 WSS 可获取详细错误信息,便于问题排查;敏感词预检测机制提前规避违规风险,保障使用安全。整体体验上,工具兼顾功能性与易用性,让用户专注于创作本身而非技术实现细节。
技术优势
技术层面,midjourney-proxy 采用 Java 开发,基于 Maven 构建,结构清晰且易于维护;通过 WebSocket(WSS)协议与 Discord 实时通信,确保任务状态同步与错误信息捕获的及时性;任务存储支持内存(默认)与 Redis 两种方式,兼顾轻量部署与分布式场景需求。多账号任务队列设计实现负载均衡,避免单账号压力过大;容器化部署(Docker)确保环境一致性,简化跨平台部署流程。此外,敏感词检测模块采用可配置规则,支持自定义调整,适配不同场景需求;账号池持久化与动态维护机制提升了系统稳定性与可用性,为高并发调用提供技术保障。




京公网安备 京ICP备17006096号-3