diff --git a/xtts/bridge.js b/xtts/bridge.js
index 1fef8d0..da2a5eb 100644
--- a/xtts/bridge.js
+++ b/xtts/bridge.js
@@ -216,13 +216,15 @@ function streamXTTSAsPCM(text, language, speakerWav, onPcmChunk) {
   return new Promise((resolve, reject) => {
     // Wichtig: speaker_wav MUSS als Query-Key dabei sein (Pydantic required) —
     // auch bei default-voice mit leerem Wert. Sonst gibt's HTTP 422.
-    // stream_chunk_size=200: XTTS rendert groessere Text-Happen, d.h. weniger
-    // Pausen zwischen Chunks (wenn RTF > 1 ist der Buffer sonst oft leer).
+    // stream_chunk_size=100: Kompromiss zwischen first-audio-latency und
+    // gap-risk. Bei RTX 3060 (RTF 1.48) ~3s bis erster Audio, Chunks gross
+    // genug dass der AudioTrack-Buffer (128KB ≈ 2.7s) zwischen Chunks nicht
+    // leerlauft.
     const qs = new URLSearchParams();
     qs.set("text", text);
     qs.set("language", language || "de");
     qs.set("speaker_wav", speakerWav || "");
-    qs.set("stream_chunk_size", "200");
+    qs.set("stream_chunk_size", "100");
 
     const url = new URL(XTTS_API_URL);
     const fullPath = `/tts_stream?${qs.toString()}`;