docs: BigVGAN-Warnung deutlich — funktioniert nicht mit unserem Vocos-Setup

Die BigVGAN-Variante des aihpi F5-TTS Checkpoints ist nicht einfach ein
"optional besser" Fallback — sie ist mit dem Default-Vocos-Vocoder den die
f5-tts Library laedt inkompatibel. Output wird NaN, App bleibt stumm.

Stefan hat das probiert, App stumm, 10 Minuten Debugging. README war zu
locker formuliert ("Meist hoehere Quali") — jetzt klar als "funktioniert
AKTUELL NICHT" gekennzeichnet.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
duffyduck 2026-04-24 19:49:54 +02:00
parent 958c8d6fc6
commit 4f494daffb
1 changed files with 5 additions and 3 deletions

View File

@ -671,9 +671,11 @@ auf dem Emilia-Dataset + Common Voice 19.0 funktioniert deutlich besser.
geladen (~3-5GB, landet im `xtts/hf-cache/`) und bei Container-Restart aus
dem Cache wiederverwendet.
> **BigVGAN-Variante**: alternativ `hf://aihpi/F5-TTS-German/F5TTS_Base_bigvgan/model_295000.safetensors`.
> Meist hoehere Audio-Qualitaet, aber groesser. Erst Vocos probieren, bei
> Bedarf umstellen.
> **Warnung zur BigVGAN-Variante** (`F5TTS_Base_bigvgan/model_295000.safetensors`):
> funktioniert AKTUELL NICHT mit dieser Bridge. Die f5-tts Library laedt
> per Default den Vocos-Vocoder, die BigVGAN-Weights sind damit inkompatibel
> → Modell produziert NaN, App bleibt stumm. Nur die **Vocos-Variante
> (F5TTS_Base/model_365000.safetensors)** nutzen.
---