2ad1f57382
- Bridge: _emit_activity() spiegelt OpenClaw agent events als agent_activity an RVS, dedupliziert State-Wechsel. chat:final/error senden idle. - Bridge: Neuer cancel_request-Handler ruft Diagnostic /api/cancel per HTTP. - Diagnostic: Neuer POST /api/cancel Endpoint (gleiche Logik wie WS-Cancel). - RVS: agent_activity + cancel_request in ALLOWED_TYPES. - App: Gelber Indicator ueber der Input-Bar mit Text je nach Activity, roter Abbrechen-Button. Cancel sendet cancel_request via RVS. - issue.md: Erledigte Bugfixes + Features konsolidiert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
3.1 KiB
3.1 KiB
ARIA Issues & Features
Erledigt
- Bildupload funktioniert (Shared Volume /shared/uploads/)
- Sprachnachrichten werden als Text angezeigt (STT → Chat-Bubble)
- Cache leeren + Auto-Download von Anhaengen
- ARIA liest Nachrichten vor (TTS via Piper)
- Autoscroll zur letzten Nachricht (inverted FlatList)
- Bilder im Chat groesser + Vollbild-Vorschau
- Ohr-Button → Gespraechsmodus (Auto-Aufnahme nach ARIA-Antwort)
- Play-Button in ARIA-Nachrichten fuer Sprachwiedergabe
- Chat-Suche in der App (Lupe in Statusleiste)
- Watchdog mit Container-Restart (2min Warnung → 5min doctor --fix → 8min Restart)
- Abbrechen-Button im Diagnostic Chat
- Nachrichten Backup on-the-fly (/shared/config/chat_backup.jsonl)
- Grosse Nachrichten satzweise aufteilen fuer TTS
- RVS Nachrichten vom Smartphone gehen durch
- Stimmen-Einstellungen (Ramona/Thorsten, Speed pro Stimme)
- Highlight-Trigger konfigurierbar in Diagnostic
- XTTS v2 Integration (Gaming-PC, GPU, Voice Cloning)
- XTTS Voice Cloning (Audio-Samples hochladen, eigene Stimme)
- TTS Engine waehlbar (Piper/XTTS) in Diagnostic + App
- Auto-Update System (APK via RVS WebSocket)
- Auto-Update: APK-Installation via FileProvider
- Auto-Update: "Auf Updates pruefen" Button in App-Einstellungen
- Audio-Queue (sequentielle Wiedergabe, kein Ueberlappen)
- Textnachrichten werden von ARIA beantwortet (Bridge chat handler fix)
- Mehrere Anhaenge + Text vor dem Senden (Pending-Vorschau)
- Paste-Support fuer Bilder in Diagnostic Chat
- Markdown-Bereinigung fuer TTS (fett, kursiv, code, links, etc.)
- SSH Volume read-write fuer Proxy (kein -F Workaround mehr)
- Diagnostic: Sessions als Markdown exportieren (Download-Button)
- Speech Gate: Aufnahme wird verworfen wenn keine Sprache erkannt (verhindert dass Umgebungsgeraeusche an Whisper gehen)
- Session-Persistenz: Gewaehlte Session bleibt ueber Container-Restarts erhalten (sessionFromFile-Flag, atomic write)
- Diagnostic: "ARIA denkt..." bleibt nicht mehr stehen (pipelineEnd broadcastet immer idle, auch bei Timeout/Fehler/Disconnect)
- App: "ARIA denkt..." Indicator + Abbrechen-Button (Bridge spiegelt agent_activity via RVS)
Offen
Bugs (Prioritaet)
- App: Audioausgabe hoert ab und zu einfach auf (mitten im Satz oder zwischen Chunks)
App Features
- Wake Word on-device (Porcupine "ARIA" Keyword, Phase 2 — passives Lauschen)
- Chat-History zuverlaessiger laden (AsyncStorage Race Condition)
- Background Audio Service (TTS auch bei minimierter App)
TTS / Audio
- XTTS Audio-Streaming (PCM-Stream statt WAV-Dateien, eliminiert Stottern komplett)
- Audio-Normalisierung (Lautstaerke zwischen Chunks angleichen)
- Piper Voices Download ueber Diagnostic (neue Sprachen/Stimmen)
Architektur
- Bilder: Claude Vision direkt nutzen (aktuell nur Dateipfad an ARIA)
- Auto-Compacting und Memory/Brain Verwaltung (SQLite?)
- Diagnostic: System-Info Tab (Container-Status, Disk, RAM, CPU)
- RVS Zombie-Connections endgueltig loesen