2.7 KiB
2.7 KiB
ARIA Issues & Features
Erledigt
- Bildupload funktioniert (Shared Volume /shared/uploads/)
- Sprachnachrichten werden als Text angezeigt (STT → Chat-Bubble)
- Cache leeren + Auto-Download von Anhaengen
- ARIA liest Nachrichten vor (TTS via Piper)
- Autoscroll zur letzten Nachricht
- Bilder im Chat groesser + Vollbild-Vorschau
- Ohr-Button Absturz gefixt (LiveAudioStream entfernt, Phase 1 Placeholder)
- Play-Button in ARIA-Nachrichten fuer Sprachwiedergabe
- Chat-Suche in der App (Lupe in Statusleiste)
- Watchdog mit Container-Restart (2min Warnung → 5min doctor --fix → 8min Restart)
- Abbrechen-Button im Diagnostic Chat
- Nachrichten Backup on-the-fly (/shared/config/chat_backup.jsonl)
- Grosse Nachrichten satzweise aufteilen fuer TTS
- RVS Nachrichten vom Smartphone gehen durch
- Stimmen-Einstellungen (Ramona/Thorsten, Speed pro Stimme)
- Highlight-Trigger konfigurierbar in Diagnostic
- XTTS v2 Integration (Gaming-PC, GPU, Voice Cloning)
- XTTS Voice Cloning (Audio-Samples hochladen, eigene Stimme)
- TTS Engine waehlbar (Piper/XTTS) in Diagnostic + App
- Auto-Update System (APK via RVS WebSocket)
- Audio-Queue (sequentielle Wiedergabe, kein Ueberlappen)
Offen
Bugs (Prioritaet)
- Session-Persistenz: Bei Container-Restart wird immer aria-bridge geladen statt die zuletzt gewaehlte Session. Wird nicht persistent gespeichert.
- App: Textnachrichten, Bilder und Anhaenge werden von ARIA nicht beantwortet — nur Sprachnachrichten funktionieren.
- App: Audioausgabe hoert ab und zu einfach auf (mitten im Satz oder zwischen Chunks)
- Auto-Update: release.sh kopiert APK nicht auf den RVS-Server (rvs/updates/ bleibt leer)
- App: Kein Auto-Scroll zur letzten Nachricht beim App-Start (soll direkt springen, nicht animiert scrollen)
- App: Bei neuen Nachrichten soll automatisch zur letzten Nachricht gescrollt werden
App Features
- App: Zu Anhaengen noch Text/Sprache hinzufuegen koennen (z.B. Bild senden + "Was siehst du?")
- Wake Word on-device (Porcupine "ARIA" Keyword, Phase 2)
- Chat-History zuverlaessiger laden (AsyncStorage Race Condition)
- Background Audio Service (TTS auch bei minimierter App)
TTS / Audio
- XTTS Audio-Streaming verbessern (minimales Stottern bei Chunk-Uebergaengen)
- Audio-Normalisierung (Lautstaerke zwischen Chunks angleichen)
- Piper Voices Download ueber Diagnostic (neue Sprachen/Stimmen)
Architektur
- Bilder: Claude Vision direkt nutzen (aktuell nur Dateipfad an ARIA)
- Auto-Compacting und Memory/Brain Verwaltung (SQLite?)
- Diagnostic: System-Info Tab (Container-Status, Disk, RAM, CPU)
- RVS Zombie-Connections endgueltig loesen (WebRTC statt WebSocket?)