ARIA-AGENT/issue.md

2.7 KiB

ARIA Issues & Features

Erledigt

  • Bildupload funktioniert (Shared Volume /shared/uploads/)
  • Sprachnachrichten werden als Text angezeigt (STT → Chat-Bubble)
  • Cache leeren + Auto-Download von Anhaengen
  • ARIA liest Nachrichten vor (TTS via Piper)
  • Autoscroll zur letzten Nachricht
  • Bilder im Chat groesser + Vollbild-Vorschau
  • Ohr-Button Absturz gefixt (LiveAudioStream entfernt, Phase 1 Placeholder)
  • Play-Button in ARIA-Nachrichten fuer Sprachwiedergabe
  • Chat-Suche in der App (Lupe in Statusleiste)
  • Watchdog mit Container-Restart (2min Warnung → 5min doctor --fix → 8min Restart)
  • Abbrechen-Button im Diagnostic Chat
  • Nachrichten Backup on-the-fly (/shared/config/chat_backup.jsonl)
  • Grosse Nachrichten satzweise aufteilen fuer TTS
  • RVS Nachrichten vom Smartphone gehen durch
  • Stimmen-Einstellungen (Ramona/Thorsten, Speed pro Stimme)
  • Highlight-Trigger konfigurierbar in Diagnostic
  • XTTS v2 Integration (Gaming-PC, GPU, Voice Cloning)
  • XTTS Voice Cloning (Audio-Samples hochladen, eigene Stimme)
  • TTS Engine waehlbar (Piper/XTTS) in Diagnostic + App
  • Auto-Update System (APK via RVS WebSocket)
  • Audio-Queue (sequentielle Wiedergabe, kein Ueberlappen)

Offen

Bugs (Prioritaet)

  • Session-Persistenz: Bei Container-Restart wird immer aria-bridge geladen statt die zuletzt gewaehlte Session. Wird nicht persistent gespeichert.
  • App: Textnachrichten, Bilder und Anhaenge werden von ARIA nicht beantwortet — nur Sprachnachrichten funktionieren.
  • App: Audioausgabe hoert ab und zu einfach auf (mitten im Satz oder zwischen Chunks)
  • Auto-Update: release.sh kopiert APK nicht auf den RVS-Server (rvs/updates/ bleibt leer)
  • App: Kein Auto-Scroll zur letzten Nachricht beim App-Start (soll direkt springen, nicht animiert scrollen)
  • App: Bei neuen Nachrichten soll automatisch zur letzten Nachricht gescrollt werden

App Features

  • App: Zu Anhaengen noch Text/Sprache hinzufuegen koennen (z.B. Bild senden + "Was siehst du?")
  • Wake Word on-device (Porcupine "ARIA" Keyword, Phase 2)
  • Chat-History zuverlaessiger laden (AsyncStorage Race Condition)
  • Background Audio Service (TTS auch bei minimierter App)

TTS / Audio

  • XTTS Audio-Streaming verbessern (minimales Stottern bei Chunk-Uebergaengen)
  • Audio-Normalisierung (Lautstaerke zwischen Chunks angleichen)
  • Piper Voices Download ueber Diagnostic (neue Sprachen/Stimmen)

Architektur

  • Bilder: Claude Vision direkt nutzen (aktuell nur Dateipfad an ARIA)
  • Auto-Compacting und Memory/Brain Verwaltung (SQLite?)
  • Diagnostic: System-Info Tab (Container-Status, Disk, RAM, CPU)
  • RVS Zombie-Connections endgueltig loesen (WebRTC statt WebSocket?)