fix: Voice-Transkription erzwingt kein "small" mehr — nutzt geladenes Modell

f5tts/bridge.py: das hardcoded model="small" in request_transcription war ein Fehler — whisper-bridge hat dadurch stumm zwischen Modellen geswappt. Wenn User large-v3 in Diagnostic eingestellt hatte: - f5tts Voice-Transkribierung triggerte Swap zu "small" (+~500MB Laden) - Danach aria-bridge schickte naechsten stt_request mit large-v3 (+~3GB Laden weil small jetzt im RAM war) Doppelter Load, unnoetiger Traffic. Fix: - f5tts: kein model mehr im payload, whisper-bridge entscheidet - whisper: wenn kein payload.model UND bereits ein Modell geladen → das behalten. Nur wenn gar nichts da ist fallback auf WHISPER_MODEL env default. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-04-24 20:03:45 +02:00
parent 4f494daffb
commit 58fd8721e3
2 changed files with 9 additions and 2 deletions
@@ -374,7 +374,10 @@ async def request_transcription(ws, wav_path: Path, language: str = "de") -> Opt
            "requestId": request_id,
            "audio": audio_b64,
            "mimeType": "audio/wav",
-            "model": "small",  # klein reicht fuer Voice-Referenz
+            # KEIN hardcoded model — whisper-bridge nimmt das bereits
+            # geladene. Sonst wuerde hier ein Swap auf 'small' passieren und
+            # danach muesste das in Diagnostic konfigurierte Modell (z.B.
+            # large-v3) wieder geladen werden → doppelter Download.
            "language": language,
        })
        return await asyncio.wait_for(fut, timeout=_STT_TIMEOUT_S)