fix: /tts_stream als GET mit Query-Params (war 405 Method Not Allowed)

daswer123 xtts-api-server hat /tts_stream nur als GET: allow: GET → POST gab 405 → Request hing. Umstellung: - method: 'GET' - text/language/speaker_wav/stream_chunk_size als URLSearchParams im Query-String - kein body mehr (kein req.write, kein Content-Length) Ab jetzt echter streaming-Flow: Samples kommen waehrend XTTS noch rendert, time-to-first-audio ~300-500ms. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
revert: XTTS-Endpoint zurueck auf /tts_to_audio/
2026-04-20 16:52:16 +02:00 · 2026-04-20 16:48:27 +02:00 · 2026-04-20 16:42:19 +02:00 · 2026-04-20 16:35:55 +02:00
3 changed files with 14 additions and 23 deletions
@@ -79,8 +79,8 @@ android {
        applicationId "com.ariacockpit"
        minSdkVersion rootProject.ext.minSdkVersion
        targetSdkVersion rootProject.ext.targetSdkVersion
-        versionCode 403
+        versionCode 404
-        versionName "0.0.4.3"
+        versionName "0.0.4.4"
        // Fallback fuer Libraries mit Product Flavors
        missingDimensionStrategy 'react-native-camera', 'general'
    }
@@ -1,6 +1,6 @@
 {
  "name": "aria-cockpit",
-  "version": "0.0.4.3",
+  "version": "0.0.4.4",
  "private": true,
  "scripts": {
    "android": "react-native run-android",
@@ -195,35 +195,27 @@ async function _runTTSRequest(payload) {
 }
 /**
- * Ruft /tts_to_audio/ auf und streamt das resultierende WAV bereits waehrend
+ * Ruft /tts_stream (GET) auf — echter Streaming-Endpoint bei daswer123.
- * des Empfangs in PCM-Frames an den Callback. Der WAV-Header wird einmal
+ * Samples fliessen waehrend XTTS rendert (chunked transfer).
- * geparst, danach werden nur noch raw PCM-Samples weitergeleitet.
+ * Time-to-first-audio ~300-500ms statt 2-4s beim batch-Endpoint.
 *
- * Warum nicht echtes /tts_stream/? daswer123 hat den Endpoint, aber die
+ * Parameter werden als Query-String uebergeben (GET-API).
 * Audio-Quality ist dort niedriger und er produziert beim ersten Chunk
 * oft Artefakte. Pragmatischer Weg: /tts_to_audio/ + Response-Stream
 * chunkweise auslesen. Das ist zwar kein echtes Server-Streaming, aber
 * gibt uns deutlich kleinere Netzwerk-Haeppchen und die App kann via
 * AudioTrack MODE_STREAM sofort nahtlos abspielen.
 */
 function streamXTTSAsPCM(text, language, speakerWav, onPcmChunk) {
  return new Promise((resolve, reject) => {
-    const body = JSON.stringify({
+    const qs = new URLSearchParams({
      text,
-      language,
+      language: language || "de",
-      speaker_wav: speakerWav || "",
+      speaker_wav: speakerWav ? speakerWav : "",
      stream_chunk_size: "40",
    });
-    const url = new URL(`${XTTS_API_URL}/tts_to_audio/`);
+    const url = new URL(`${XTTS_API_URL}/tts_stream?${qs.toString()}`);
    const options = {
      hostname: url.hostname,
      port: url.port,
-      path: url.pathname,
+      path: `${url.pathname}?${url.searchParams.toString()}`,
-      method: "POST",
+      method: "GET",
      headers: {
        "Content-Type": "application/json",
        "Content-Length": Buffer.byteLength(body),
      },
      timeout: 60000,
    };
@@ -285,7 +277,6 @@ function streamXTTSAsPCM(text, language, speakerWav, onPcmChunk) {
    req.on("error", reject);
    req.on("timeout", () => { req.destroy(); reject(new Error("XTTS API Timeout (60s)")); });
    req.write(body);
    req.end();
  });
 }
Author	SHA1	Message	Date
duffyduck	9b5a35cb4a	fix: /tts_stream als GET mit Query-Params (war 405 Method Not Allowed) daswer123 xtts-api-server hat /tts_stream nur als GET: allow: GET → POST gab 405 → Request hing. Umstellung: - method: 'GET' - text/language/speaker_wav/stream_chunk_size als URLSearchParams im Query-String - kein body mehr (kein req.write, kein Content-Length) Ab jetzt echter streaming-Flow: Samples kommen waehrend XTTS noch rendert, time-to-first-audio ~300-500ms. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-20 16:52:16 +02:00
duffyduck	5ac1a0a522	revert: XTTS-Endpoint zurueck auf /tts_to_audio/ /tts_stream war bei der aktiven daswer123-Version nicht erreichbar — Requests hingen stille, App bekam kein Audio. Zurueck auf /tts_to_audio/ + Queue + 32x AudioTrack-Buffer. Das ist zwar nicht echt-streaming aber stabil. Ueberlappung sollte durch die Queue weg sein, Buffer toleriert den bursty Delivery. Echt-Streaming-Migration spaeter mit verifizierter Server-Version oder anderem Endpoint. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-20 16:48:27 +02:00
duffyduck	a28b46a809	release: bump version to 0.0.4.4	2026-04-20 16:42:19 +02:00
duffyduck	59c8d36a3d	fix: Streaming TTS nutzt jetzt echt den /tts_stream Endpoint von XTTS Vorher: /tts_to_audio/ — XTTS rendert kompletten WAV BEVOR es antwortet. Mein "streaming" war nur fake-chunking des fertigen WAV. Time-to-first-audio = komplette Render-Zeit (2-4s), dann Burst, dann Stille. Plus bei langen Antworten: Queue blockiert. Jetzt: /tts_stream — daswer123's chunked-transfer endpoint. Samples flutschen waehrend der Generierung durch die Response raus. Parameter: - stream_chunk_size=40 → XTTS rendert in ~40-char Haeppchen intern, time-to-first-audio ~300-500ms statt 2-4s - WAV-Header kommt wie gewohnt am Anfang (44 Bytes), danach raw PCM → mein existierender Header-Parser + 8KB-Chunker passen weiter Voraussetzung: daswer123/xtts-api-server hat diesen Endpoint (ab Version ~0.8.x). Sollte bei der aktuellen Version drin sein. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-20 16:35:55 +02:00