fix(f5tts): cfg_strength hochgezogen damit Deutsch nicht ins Spanische rutscht

F5TTS_v1_Base ist hauptsaechlich auf Englisch+Chinesisch trainiert; bei
Deutsch (oder anderen Romance/Germanic-Sprachen) schwimmt der Generator
ohne starkes Conditioning gerne in eine andere Sprache.

- cfg_strength 2.0 → 2.5 (per ENV F5TTS_CFG_STRENGTH ueberschreibbar)
- nfe_step bleibt 32 (per ENV ueberschreibbar)
- F5TTS_CKPT_FILE / F5TTS_VOCAB_FILE als ENV — damit man eine Community-
  German-Checkpoint einhaengen kann ohne Code-Aenderung

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
2026-04-24 15:30:08 +02:00
parent 22fa4b3ccf
commit c1a5518fb7
2 changed files with 27 additions and 3 deletions
+4
View File
@@ -39,7 +39,11 @@ services:
- RVS_TLS_FALLBACK=${RVS_TLS_FALLBACK:-true}
- RVS_TOKEN=${RVS_TOKEN}
- F5TTS_MODEL=${F5TTS_MODEL:-F5TTS_v1_Base}
- F5TTS_CKPT_FILE=${F5TTS_CKPT_FILE:-}
- F5TTS_VOCAB_FILE=${F5TTS_VOCAB_FILE:-}
- F5TTS_DEVICE=${F5TTS_DEVICE:-cuda}
- F5TTS_CFG_STRENGTH=${F5TTS_CFG_STRENGTH:-2.5}
- F5TTS_NFE_STEP=${F5TTS_NFE_STEP:-32}
- VOICES_DIR=/voices
restart: unless-stopped