ARIA-AGENT/xtts
duffyduck 59c8d36a3d fix: Streaming TTS nutzt jetzt echt den /tts_stream Endpoint von XTTS
Vorher: /tts_to_audio/ — XTTS rendert kompletten WAV BEVOR es
antwortet. Mein "streaming" war nur fake-chunking des fertigen WAV.
Time-to-first-audio = komplette Render-Zeit (2-4s), dann Burst,
dann Stille. Plus bei langen Antworten: Queue blockiert.

Jetzt: /tts_stream — daswer123's chunked-transfer endpoint.
Samples flutschen waehrend der Generierung durch die Response raus.

Parameter:
- stream_chunk_size=40 → XTTS rendert in ~40-char Haeppchen intern,
  time-to-first-audio ~300-500ms statt 2-4s
- WAV-Header kommt wie gewohnt am Anfang (44 Bytes), danach raw PCM
  → mein existierender Header-Parser + 8KB-Chunker passen weiter

Voraussetzung: daswer123/xtts-api-server hat diesen Endpoint (ab
Version ~0.8.x). Sollte bei der aktuellen Version drin sein.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-04-20 16:35:55 +02:00
..
.env.example feat: XTTS v2 integration, auto-update system, TTS engine abstraction 2026-04-05 19:42:10 +02:00
Dockerfile feat: XTTS v2 integration, auto-update system, TTS engine abstraction 2026-04-05 19:42:10 +02:00
bridge.js fix: Streaming TTS nutzt jetzt echt den /tts_stream Endpoint von XTTS 2026-04-20 16:35:55 +02:00
docker-compose.yml fix: XTTS bridge shares /voices volume with XTTS server 2026-04-10 01:40:41 +02:00
package.json feat: XTTS v2 integration, auto-update system, TTS engine abstraction 2026-04-05 19:42:10 +02:00