docs: BigVGAN-Warnung deutlich — funktioniert nicht mit unserem Vocos-Setup

Die BigVGAN-Variante des aihpi F5-TTS Checkpoints ist nicht einfach ein "optional besser" Fallback — sie ist mit dem Default-Vocos-Vocoder den die f5-tts Library laedt inkompatibel. Output wird NaN, App bleibt stumm. Stefan hat das probiert, App stumm, 10 Minuten Debugging. README war zu locker formuliert ("Meist hoehere Quali") — jetzt klar als "funktioniert AKTUELL NICHT" gekennzeichnet. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-04-24 19:49:54 +02:00
parent 958c8d6fc6
commit 4f494daffb
1 changed files with 5 additions and 3 deletions
@@ -671,9 +671,11 @@ auf dem Emilia-Dataset + Common Voice 19.0 funktioniert deutlich besser.
 geladen (~3-5GB, landet im `xtts/hf-cache/`) und bei Container-Restart aus
 dem Cache wiederverwendet.

-> **BigVGAN-Variante**: alternativ `hf://aihpi/F5-TTS-German/F5TTS_Base_bigvgan/model_295000.safetensors`.
-> Meist hoehere Audio-Qualitaet, aber groesser. Erst Vocos probieren, bei
-> Bedarf umstellen.
+> **Warnung zur BigVGAN-Variante** (`F5TTS_Base_bigvgan/model_295000.safetensors`):
+> funktioniert AKTUELL NICHT mit dieser Bridge. Die f5-tts Library laedt
+> per Default den Vocos-Vocoder, die BigVGAN-Weights sind damit inkompatibel
+> → Modell produziert NaN, App bleibt stumm. Nur die **Vocos-Variante
+> (F5TTS_Base/model_365000.safetensors)** nutzen.

 ---