diff --git a/README.md b/README.md index c4a6b06..365164d 100644 --- a/README.md +++ b/README.md @@ -671,9 +671,11 @@ auf dem Emilia-Dataset + Common Voice 19.0 funktioniert deutlich besser. geladen (~3-5GB, landet im `xtts/hf-cache/`) und bei Container-Restart aus dem Cache wiederverwendet. -> **BigVGAN-Variante**: alternativ `hf://aihpi/F5-TTS-German/F5TTS_Base_bigvgan/model_295000.safetensors`. -> Meist hoehere Audio-Qualitaet, aber groesser. Erst Vocos probieren, bei -> Bedarf umstellen. +> **Warnung zur BigVGAN-Variante** (`F5TTS_Base_bigvgan/model_295000.safetensors`): +> funktioniert AKTUELL NICHT mit dieser Bridge. Die f5-tts Library laedt +> per Default den Vocos-Vocoder, die BigVGAN-Weights sind damit inkompatibel +> → Modell produziert NaN, App bleibt stumm. Nur die **Vocos-Variante +> (F5TTS_Base/model_365000.safetensors)** nutzen. ---