diff --git a/xtts/bridge.js b/xtts/bridge.js
index b48bcbd..5b9fc11 100644
--- a/xtts/bridge.js
+++ b/xtts/bridge.js
@@ -195,12 +195,13 @@ async function _runTTSRequest(payload) {
 }
 
 /**
- * Ruft /tts_stream auf — echter Streaming-Endpoint von daswer123.
- * Chunked Transfer-Encoding: Samples kommen WAEHREND XTTS rendert,
- * nicht erst am Ende. Time-to-first-audio ~300-500ms statt 2-3s.
+ * Ruft /tts_to_audio/ auf und streamt das Response-Body chunkweise an
+ * den Callback. Kein echtes Server-Streaming (XTTS rendert komplett
+ * bevor es antwortet), aber stabil und mit der Queue + grosszuegigem
+ * AudioTrack-Buffer klingt's akzeptabel.
  *
- * stream_chunk_size = Characters pro Render-Iteration.
- * 40 = guter Kompromiss zwischen Schnellstart und GPU-Effizienz.
+ * /tts_stream ist elegant, funktioniert aber nicht in allen Versionen
+ * von daswer123/xtts-api-server.
  */
 function streamXTTSAsPCM(text, language, speakerWav, onPcmChunk) {
   return new Promise((resolve, reject) => {
@@ -208,10 +209,9 @@ function streamXTTSAsPCM(text, language, speakerWav, onPcmChunk) {
       text,
       language,
       speaker_wav: speakerWav || "",
-      stream_chunk_size: 40,
     });
 
-    const url = new URL(`${XTTS_API_URL}/tts_stream`);
+    const url = new URL(`${XTTS_API_URL}/tts_to_audio/`);
     const options = {
       hostname: url.hostname,
       port: url.port,