diff --git a/xtts/bridge.js b/xtts/bridge.js index e5ad399..1fef8d0 100644 --- a/xtts/bridge.js +++ b/xtts/bridge.js @@ -216,11 +216,13 @@ function streamXTTSAsPCM(text, language, speakerWav, onPcmChunk) { return new Promise((resolve, reject) => { // Wichtig: speaker_wav MUSS als Query-Key dabei sein (Pydantic required) — // auch bei default-voice mit leerem Wert. Sonst gibt's HTTP 422. + // stream_chunk_size=200: XTTS rendert groessere Text-Happen, d.h. weniger + // Pausen zwischen Chunks (wenn RTF > 1 ist der Buffer sonst oft leer). const qs = new URLSearchParams(); qs.set("text", text); qs.set("language", language || "de"); qs.set("speaker_wav", speakerWav || ""); - qs.set("stream_chunk_size", "40"); + qs.set("stream_chunk_size", "200"); const url = new URL(XTTS_API_URL); const fullPath = `/tts_stream?${qs.toString()}`;