From 57e65b061c9b1560edd9099c9ba89a2d73aa5d0b Mon Sep 17 00:00:00 2001 From: duffyduck Date: Fri, 10 Apr 2026 02:38:21 +0200 Subject: [PATCH] docs: update issue.md with XTTS streaming as next priority Co-Authored-By: Claude Opus 4.6 (1M context) --- issue.md | 15 ++++++++++++--- 1 file changed, 12 insertions(+), 3 deletions(-) diff --git a/issue.md b/issue.md index d2cc761..ef99207 100644 --- a/issue.md +++ b/issue.md @@ -18,19 +18,28 @@ - [x] RVS Nachrichten vom Smartphone gehen durch - [x] Stimmen-Einstellungen (Ramona/Thorsten, Speed pro Stimme) - [x] Highlight-Trigger konfigurierbar in Diagnostic +- [x] XTTS v2 Integration (Gaming-PC, GPU, Voice Cloning) +- [x] XTTS Voice Cloning (Audio-Samples hochladen, eigene Stimme) +- [x] TTS Engine waehlbar (Piper/XTTS) in Diagnostic + App +- [x] Auto-Update System (APK via RVS WebSocket) +- [x] Audio-Queue (sequentielle Wiedergabe, kein Ueberlappen) ## Offen -### TTS / Stimmen -- [ ] TTS Engine waehlbar: Piper (CPU, schnell) oder Coqui XTTS v2 (GPU, natuerlicher) +### TTS / Audio (Prioritaet) +- [ ] XTTS Audio-Streaming statt Einzel-Dateien (WebRTC oder Opus-Stream) + → Verhindert Stottern/Abgehacktheit bei langen Antworten + → Zusammengefuegter Stream statt Queue von WAV-Dateien +- [ ] Audio-Normalisierung (Lautstaerke zwischen Chunks angleichen) - [ ] Piper Voices Download ueber Diagnostic (neue Sprachen/Stimmen) -- [ ] Coqui XTTS v2 Integration (braucht GPU, bessere deutsche Stimme) ### App - [ ] Wake Word on-device (Porcupine "ARIA" Keyword, Phase 2) - [ ] Chat-History zuverlaessiger laden (AsyncStorage Race Condition) +- [ ] Background Audio Service (TTS auch bei minimierter App) ### Architektur - [ ] Bilder: Claude Vision direkt nutzen (aktuell nur Dateipfad an ARIA) - [ ] Auto-Compacting und Memory/Brain Verwaltung (SQLite?) - [ ] Diagnostic: System-Info Tab (Container-Status, Disk, RAM, CPU) +- [ ] RVS Zombie-Connections endgueltig loesen (WebRTC statt WebSocket?)