From 23add7a1072f43029d639989e190d4c80a32ea11 Mon Sep 17 00:00:00 2001 From: duffyduck Date: Sun, 19 Apr 2026 14:04:47 +0200 Subject: [PATCH] docs: Neue Issues - TTS-Cleanup, Audio-Ducking, Config-UI, NO_REPLY-Bug MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit - Bug: NO_REPLY wird als "NO" angezeigt - Audio-Ducking + Mute waehrend Aufnahme - Spracheingabe-Timeout erhoehen - TTS-Text-Aufbereitung (Code raus, Einheiten ausschreiben) - Audio-Cache in Messages (kein Regenerieren beim Play-Button) - Piper evtl. entfernen - .env → Diagnostic UI migrieren - QR-Code Onboarding - XTTS Web-Oberflaeche / zentral via Diagnostic - Root-Cause OpenClaw Session-Reset pruefen Co-Authored-By: Claude Opus 4.7 (1M context) --- issue.md | 11 +++++++++++ 1 file changed, 11 insertions(+) diff --git a/issue.md b/issue.md index b43f281..abd3150 100644 --- a/issue.md +++ b/issue.md @@ -46,19 +46,30 @@ ### Bugs (Prioritaet) - [ ] App: Audioausgabe hoert ab und zu einfach auf (mitten im Satz oder zwischen Chunks) +- [ ] NO_REPLY wird als "NO" im Chat angezeigt — sollte still verworfen werden (Token nicht gesaeubert) ### App Features - [ ] Wake Word on-device (Porcupine "ARIA" Keyword, Phase 2 — passives Lauschen) - [ ] Chat-History zuverlaessiger laden (AsyncStorage Race Condition) - [ ] Background Audio Service (TTS auch bei minimierter App) +- [ ] Audio-Ducking: andere App-Audio-Ausgaben leiser stellen waehrend ARIA spricht (AudioFocus API) +- [ ] Audio-Muten waehrend Aufnahme/Ohr-Modus: andere Audio stumm (wie WhatsApp-Sprachaufnahme) +- [ ] Spracheingabe-Timeout erhoehen fuer laengere Texte +- [ ] Generierte TTS-Audiodaten in der Chat-Nachricht einbetten (oder lokal cachen), Play-Button spielt aus Cache statt Regenerierung via XTTS. Base64 im Tag (invisible) oder lokaler Datei-Cache mit Referenz in der Message. +- [ ] QR-Code Onboarding: Diagnostic generiert QR mit RVS-Credentials, App scannt — keine manuelle Eingabe mehr ### TTS / Audio - [ ] XTTS Audio-Streaming (PCM-Stream statt WAV-Dateien, eliminiert Stottern komplett) - [ ] Audio-Normalisierung (Lautstaerke zwischen Chunks angleichen) - [ ] Piper Voices Download ueber Diagnostic (neue Sprachen/Stimmen) +- [ ] TTS-Text-Aufbereitung: Code-Bloecke rausfiltern, Einheiten ausschreiben ("22GB" → "zweiundzwanzig Gigabyte"). Zwei Varianten denkbar: (a) server-side Cleanup in Bridge, (b) ARIA schreibt `` Block der in UI hidden bleibt aber fuer TTS genutzt wird. +- [ ] Piper evtl. komplett entfernen (klingt schlecht vs. XTTS) — oder nur als Fallback wenn XTTS offline ist ### Architektur - [ ] Bilder: Claude Vision direkt nutzen (aktuell nur Dateipfad an ARIA) - [ ] Auto-Compacting und Memory/Brain Verwaltung (SQLite?) - [ ] Diagnostic: System-Info Tab (Container-Status, Disk, RAM, CPU) - [ ] RVS Zombie-Connections endgueltig loesen +- [ ] Alle .env-Variablen ueber Diagnostic konfigurierbar machen (kein File-Sync mehr noetig, da alle ARIA-Container auf der gleichen VM laufen). Fallback .env bleibt fuer initialen Bootstrap. +- [ ] XTTS-Container: kleine Web-Oberflaeche fuer Credentials/Server-Config, oder zentral aus Diagnostic per RVS push +- [ ] Root-Cause OpenClaw Session-Reset: Herausfinden warum Sessions beim ersten chat.send nach Container-Restart verworfen werden (abortedLastRun / systemSent Theorie pruefen, ggf. Flag preemptiv patchen)