diff --git a/README.md b/README.md index 51486b1..c39c383 100644 --- a/README.md +++ b/README.md @@ -306,7 +306,8 @@ aria-core → Antwort → Gateway → Diagnostic → RVS → App ### Features - **STT**: faster-whisper (lokal, offline, 16kHz mono) -- **TTS**: Piper (Ramona + Thorsten, offline) +- **TTS**: Piper (Ramona + Thorsten, offline) oder XTTS v2 (remote, GPU, Voice Cloning) +- **Markdown-Bereinigung**: Entfernt **fett**, *kursiv*, `code`, Links, Listen etc. vor TTS (natuerliche Sprache) - **Wake-Word**: openwakeword (lokales Mikrofon auf der VM) - **App-Audio**: Base64 Audio von App → FFmpeg → Whisper STT → Text an aria-core - **Modi**: Normal, Nicht stoeren, Fluestern, Hangar, Gaming @@ -367,15 +368,17 @@ API-Endpoint fuer andere Services: `GET http://localhost:3001/api/session` - Text-Chat mit ARIA - **Sprachaufnahme**: Push-to-Talk (halten) oder Tap-to-Talk (tippen, Auto-Stop bei Stille) +- **Gespraechsmodus** (Ohr-Button): Nach jeder ARIA-Antwort startet automatisch die Aufnahme — wie ein natuerliches Gespraech hin und her, ohne Buttons druecken - **VAD (Voice Activity Detection)**: Erkennt 1.8s Stille und stoppt automatisch - **STT (Speech-to-Text)**: Audio wird in der Bridge per Whisper transkribiert, transkribierter Text erscheint im Chat -- **TTS-Wiedergabe**: ARIA antwortet per Lautsprecher (Piper oder XTTS v2) +- **TTS-Wiedergabe**: ARIA antwortet per Lautsprecher (Piper oder XTTS v2), Audio-Queue mit Preloading - **Play-Button**: Jede ARIA-Nachricht kann nochmal vorgelesen werden - **Chat-Suche**: Lupe in der Statusleiste filtert Nachrichten live -- **Datei- und Bild-Upload**: Bilder inline im Chat (Vollbild-Tap), Dateien mit Icon + Name + Groesse +- **Mehrere Anhaenge**: Bilder + Dateien sammeln, Text hinzufuegen, dann zusammen senden +- **Paste-Support**: Bilder aus Zwischenablage einfuegen (Diagnostic) - **Anhaenge**: Bridge speichert in Shared Volume, ARIA kann darauf zugreifen, Re-Download ueber RVS - **Einstellungen**: TTS Engine, Stimmen, Speed pro Stimme, Speicherort, Auto-Download, GPS -- **Auto-Update**: Prueft beim Start auf neue Version, Download + Installation ueber RVS +- **Auto-Update**: Prueft beim Start + per Button auf neue Version, Download + Installation ueber RVS (FileProvider) - GPS-Position (optional) - QR-Code Scanner fuer Token-Pairing @@ -709,6 +712,11 @@ docker exec aria-core ssh aria-wohnung hostname - [x] Auto-Update System (APK via RVS) - [x] Chat-Suche, Play-Button, Abbrechen-Button - [x] XTTS v2 Integration (GPU, Voice Cloning, remote ueber RVS) +- [x] Gespraechsmodus (Ohr-Button, automatische Aufnahme nach ARIA-Antwort) +- [x] Mehrere Anhaenge + Text vor dem Senden + Paste-Support +- [x] Markdown-Bereinigung fuer TTS +- [x] Auto-Update mit FileProvider + Update-Check Button +- [x] Inverted FlatList (zuverlaessiges Scroll-to-Bottom) ### Phase 2 — ARIA wird produktiv