🎉 恭喜,服务已运行成功

LazyCat Edge TTS

OpenAI API 兼容的文本转语音服务

核心功能

这是一个完全兼容 OpenAI API 的 TTS 服务,提供高质量的文本转语音功能。

OpenAI 兼容接口

提供 /v1/audio/speech 端点,与 OpenAI API 请求结构和行为完全一致

SSE 流式传输

指定 stream_format: "sse" 时启用实时音频流传输

多种音色支持

已映射 OpenAI 音色(alloy, echo, fable, onyx, nova, shimmer)可直接使用

灵活音频格式

mp3, opus, aac, flac, wav, pcm,默认 mp3

播放速度调节

可调节播放速度,范围从 0.25x 到 4.0x

直接音色选择

可使用 OpenAI 音色映射或直接指定任何 edge-tts 音色

API 使用指南

本项目作为 OpenAI API 兼容的 TTS 服务,可以直接替换 OpenAI 的 TTS 端点使用。 注意:API 地址与应用地址相同,建议使用端口转发。具体请查看下方“集成方式”

API 端点

POST /v1/audio/speech

请求参数与 OpenAI TTS API 完全兼容,包括 model、input、voice、response_format、speed 等参数。

音色选择

您可以通过以下方式选择和试听不同的音色:

访问在线音色选择器,试听所有可用的 edge-tts 音色

打开音色选择器

集成方式

与懒猫微服中需要 TTS 的应用集成

只要部署在懒猫微服中的应用需要 TTS,本应用可作为 TTS 提供商:

  1. 建议将本应用在 “局域网端口转发工具” 中转发服务
  2. 在应用中直接配置 host.lzcapp (以 Open Notebook 为例)
  3. 详情阅读文档中有详细介绍 https://lazycat.cloud/playground/guideline/566
局域网端口转发工具截图 Open Notebook 配置截图

Open WebUI 集成

在 Open WebUI 中使用本应用作为 TTS 提供商:

  1. 打开管理面板,进入 Settings -> Audio
  2. 配置 TTS 端点指向本应用的 /v1/audio/speech
  3. 设置相应的 API 密钥(如需要)
  4. 选择所需的音色和音频格式
Open WebUI 配置截图
正确配置后,Open WebUI 将使用本应用替代 OpenAI 端点进行文本转语音

AnythingLLM 集成

在 AnythingLLM 1.6.8+ 版本中支持通用 OpenAI TTS 提供商:

  1. 打开设置,进入 Voice & Speech(位于 AI Providers 下)
  2. 选择 "Generic OpenAI TTS Provider"
  3. 配置 API 端点为本应用的地址
  4. 设置 API 密钥和其他参数
AnythingLLM 配置截图
本项目可以作为 AnythingLLM 的 TTS 提供商,替代 OpenAI 端点使用