From 4f494daffba6b04f8c49ef4af2d22070f2a9daad Mon Sep 17 00:00:00 2001 From: duffyduck Date: Fri, 24 Apr 2026 19:49:54 +0200 Subject: [PATCH] =?UTF-8?q?docs:=20BigVGAN-Warnung=20deutlich=20=E2=80=94?= =?UTF-8?q?=20funktioniert=20nicht=20mit=20unserem=20Vocos-Setup?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Die BigVGAN-Variante des aihpi F5-TTS Checkpoints ist nicht einfach ein "optional besser" Fallback — sie ist mit dem Default-Vocos-Vocoder den die f5-tts Library laedt inkompatibel. Output wird NaN, App bleibt stumm. Stefan hat das probiert, App stumm, 10 Minuten Debugging. README war zu locker formuliert ("Meist hoehere Quali") — jetzt klar als "funktioniert AKTUELL NICHT" gekennzeichnet. Co-Authored-By: Claude Opus 4.7 (1M context) --- README.md | 8 +++++--- 1 file changed, 5 insertions(+), 3 deletions(-) diff --git a/README.md b/README.md index c4a6b06..365164d 100644 --- a/README.md +++ b/README.md @@ -671,9 +671,11 @@ auf dem Emilia-Dataset + Common Voice 19.0 funktioniert deutlich besser. geladen (~3-5GB, landet im `xtts/hf-cache/`) und bei Container-Restart aus dem Cache wiederverwendet. -> **BigVGAN-Variante**: alternativ `hf://aihpi/F5-TTS-German/F5TTS_Base_bigvgan/model_295000.safetensors`. -> Meist hoehere Audio-Qualitaet, aber groesser. Erst Vocos probieren, bei -> Bedarf umstellen. +> **Warnung zur BigVGAN-Variante** (`F5TTS_Base_bigvgan/model_295000.safetensors`): +> funktioniert AKTUELL NICHT mit dieser Bridge. Die f5-tts Library laedt +> per Default den Vocos-Vocoder, die BigVGAN-Weights sind damit inkompatibel +> → Modell produziert NaN, App bleibt stumm. Nur die **Vocos-Variante +> (F5TTS_Base/model_365000.safetensors)** nutzen. ---