ARIA-AGENT

Commit Graph

Author	SHA1	Message	Date
duffyduck	0fc11e33c8	docs: NO_REPLY-Bug raus — schon durch NO_REPLY-Filter (Zeile 45) erledigt War doppelt gelistet: einmal als erledigter Filter und einmal als offener "wird als NO angezeigt"-Bug. Der Filter in aria-bridge verwirft NO_REPLY-Antworten heute still, der Anzeige-Bug ist damit praktisch weg. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 00:29:29 +02:00
duffyduck	dae603541b	docs: issue.md aufgeraeumt — erledigte Items in die Done-Liste Offene Bugs auf 3 reduziert (NO_REPLY-Anzeige, Porcupine-Jarvis, Porcupine-Crash — die zwei letzten abhaengig vom ADB-Logcat-Test). App-Features-Backlog auf 2 (History-Race, Background-Audio) weil Text-Auswahl/Autolink/Speed-Setting/Voice-Preview jetzt fertig sind. Diagnostic Features-Abschnitt leer → geloescht. Erledigt-Liste um ~18 Punkte ergaenzt (F5-TTS Pre-processing, deutsches Fine-Tune, maxPayload-Fix, service_status, config_request, Conversation- Window, Porcupine, HF-Cache Bind-Mount, cleanup-windows, Mute-Bug, Zombie-Recording, Autolink, Speed-Setting, Preview-Modal). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 00:28:37 +02:00
duffyduck	87b4cd305c	docs: veraltete F5-TTS-Backlog-Items ausmisten - Audio-Normalisierung: nie aufgefallen, bei Bedarf zurueck - F5-TTS Streaming-Inferenz: Upstream-Feature, nicht unseres - Deepspeed: premature optimization, Render ist durch Pre-Roll kaschiert schnell genug - BigVGAN-Support: obsolet seit Vocos + aihpi German Fine-Tune laeuft Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 00:26:51 +02:00
duffyduck	190352820c	feat: Bug-Runde + 5 App/Diagnostic-Features Bugs: - App Mute-/Auto-Playback: onMessage-Closure hielt stale ttsDeviceEnabled/ ttsMuted → Mute wurde ignoriert + AsyncStorage-Load kam nicht durch. Fix via ttsCanPlayRef (live gespiegelt) statt Closure-Variablen. - App Zombie-Recording: toggleWakeWord hat die laufende Aufnahme nicht gestoppt → audioService.recordingState blieb 'recording' → normaler Aufnahme-Button wirkungslos. Fix: await stopRecording() vor stop(). - Porcupine robuster: BuiltInKeywords-Enum Mapping mit String-Fallback, errorCallback fuer Runtime-Crashes (state zurueck auf off statt App-Crash), mehr Logging damit man beim naechsten Issue debuggen kann. App-Features: - MessageText Komponente: Text ist durchgehend selektierbar, erkennt URLs (http/https), E-Mails, Telefonnummern und macht sie anklickbar (oeffnet Browser / Mail-App / Android-Dialer via Linking). - TTS-Wiedergabegeschwindigkeit pro Geraet einstellbar (Settings -> "Sprechgeschwindigkeit", 0.5-2.0 in 0.1-Schritten, Default 1.0). Wird als speed-Param an die F5-TTS-Bridge durchgereicht. Bridge-Durchreichen: - ChatScreen: speed aus AsyncStorage via ttsSpeedRef, an chat/audio/ tts_request mitgeschickt - aria-bridge: _next_speed_override wie voice_override, an xtts_request weitergereicht - f5tts-bridge: speed-Param an F5TTS.infer() durchgereicht Diagnostic-Feature: - Voice-Preview-Button (Play-Icon) vor dem Delete-X in der Stimmen-Liste - Modal mit Textfeld (Default-Beispieltext wird bei jedem Oeffnen neu gesetzt) und Play-Button - Server sammelt audio_pcm Frames der Preview-Anfrage, baut WAV, schickt base64 zurueck, Browser spielt im <audio>-Tag ab - 60s Timeout-Safety-Net Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 00:24:02 +02:00
duffyduck	578ade3544	docs: README + issue.md auf Stand mit F5-TTS, Whisper-Gamebox, App-Settings README: - Architektur-Diagramm: Gamebox-Stack mit f5tts-bridge + whisper-bridge - Voice Bridge: STT primaer remote (Gamebox), TTS via F5-TTS - Diagnostic-Section: Voice-Status, Disk-Voll Banner, Auto-Transkription - App-Features: VAD-Toleranz/Pre-Roll/Audio-Pause konfigurierbar - XTTS-Section ersetzt durch "Gamebox-Stack — F5-TTS + Whisper" - Roadmap Phase 1: alle juengsten Erledigungen ergaenzt issue.md: alle erledigten Punkte der letzten Iterationen aufgenommen (Pre-Roll, Decimal-TTS, voice_ready, Whisper-Gamebox, F5-TTS, AudioFocus Pause, VAD-Setting, ...). Offene Liste auf den aktuellen Stand reduziert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 14:51:27 +02:00
duffyduck	f801d99748	feat: Piper komplett entfernt — nur noch XTTS v2 als TTS Breaking Change: wenn XTTS-Bridge (Gaming-PC) offline ist, bleibt ARIA stumm. Chat-Antworten kommen weiter an, aber kein Audio. Das ist bewusst akzeptiert — XTTS klingt einfach grauenhaft viel besser. Bridge (aria_bridge.py): - from piper import ... raus - VoiceEngine-Klasse komplett entfernt (synthesize, speak, select_voice) - EPIC_TRIGGERS + load_epic_triggers raus (Highlight-Voice-Feature ohne Piper sinnlos) - self.voice_engine, voice_name, requested_voice Aufrufe weg - _process_core_response: immer XTTS, kein Fallback - tts_request Handler: immer XTTS - config Handler: nur ttsEnabled + xttsVoice + whisperModel - import wave raus bridge/requirements.txt: piper-tts raus bridge/Dockerfile: Kommentar aktualisiert docker-compose.yml: ./aria-data/voices Mount raus aria-data/config/aria.env.example: PIPER_RAMONA/PIPER_THORSTEN raus get-voices.sh: komplett geloescht (war nur Piper-Downloader) Diagnostic UI (index.html): - Piper Panel (Standard-Stimme / Highlight-Stimme / Speed-Sliders) weg - TTS Engine Dropdown weg (immer XTTS) - TTS Diagnose Tab zeigt nur noch XTTS-Status + Test-Button - sendVoiceConfig sendet nur noch ttsEnabled/xttsVoice/whisperModel - toggleXTTSPanel als no-op Legacy-Stub (JS-Calls bleiben safe) Diagnostic Server (server.js): - handleSendVoiceConfig: nur noch ttsEnabled + xttsVoice + whisperModel - handleTestTTS: via xtts_request (nicht mehr Piper subprocess) - handleCheckTTS: via xtts_list_voices ueber RVS - handleGetVoiceConfig/Defaults bereinigt - Highlight-Trigger UI bleibt, wird aber von Bridge nicht mehr ausgewertet (dead-code im UI, spaeter ggf. fuer XTTS-Voice-Switch) README + issue.md aktualisiert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 22:24:42 +02:00
duffyduck	fc3bee6d05	feat: Runtime-Config via Diagnostic UI — kein .env-Sync mehr Framework fuer zentrale Runtime-Konfiguration: - /api/runtime-config (GET/POST) persistiert in /shared/config/runtime.json - Werte haben Vorrang ueber die ENV-Variablen aus aria.env - Feldliste: RVS_HOST/PORT/TLS/TOKEN, ARIA_AUTH_TOKEN, WHISPER_MODEL/LANGUAGE - Atomic write (tmp + rename) fuer Konsistenz Bridge: - load_config() liest nach aria.env noch runtime.json und ueberschreibt die Werte. Aenderungen werden beim Neustart der Bridge uebernommen. Diagnostic UI: - Neue Sektion "Runtime-Konfiguration" in Einstellungen - Formular fuer RVS-Credentials + Aria-Auth-Token - "Speichern" persistiert, triggert auch QR-Code-Regenerierung - Hinweis: Diagnostic-Container selbst bleibt auf ENV (erstmal) issue.md konsolidiert — 6 groessere Tasks dieser Session als erledigt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 16:18:37 +02:00
duffyduck	23add7a107	docs: Neue Issues - TTS-Cleanup, Audio-Ducking, Config-UI, NO_REPLY-Bug - Bug: NO_REPLY wird als "NO" angezeigt - Audio-Ducking + Mute waehrend Aufnahme - Spracheingabe-Timeout erhoehen - TTS-Text-Aufbereitung (Code raus, Einheiten ausschreiben) - Audio-Cache in Messages (kein Regenerieren beim Play-Button) - Piper evtl. entfernen - .env → Diagnostic UI migrieren - QR-Code Onboarding - XTTS Web-Oberflaeche / zentral via Diagnostic - Root-Cause OpenClaw Session-Reset pruefen Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 14:04:47 +02:00
duffyduck	76d72a1eef	feat: Archivierte Session-Versionen (OpenClaw .reset.* Files) in Diagnostic OpenClaw resettet Sessions beim ersten chat.send nach Container-Restart (wenn abortedLastRun / systemSent Inkonsistenz erkannt wurde) und benennt die alte .jsonl in .jsonl.reset.<timestamp>.Z um. Der Inhalt war also gar nicht verloren, nur unsichtbar. Diagnostic: - handleListSessions scannt jetzt auch .jsonl.reset. Files - Reset-Files bekommen archived:true + resetAt-Timestamp - Neue UI-Sektion "Archivierte Versionen" (collapsible <details>) mit Export-Button, zeigt aufklappbar alle gesicherten alten Sessions - Aktivieren ist fuer Archive deaktiviert (zerstoert aktive Session) - Loeschen + Export stehen zur Verfuegung tools/export-jsonl-to-md.js: - Standalone Node-Script zum Konvertieren beliebiger .jsonl (auch reset-Files) - Nutzbar via stdin, exakt gleiche Export-Logik wie Diagnostic - Fuer Rettungsaktionen direkt auf der VM Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-18 12:24:54 +02:00
duffyduck	6fec8588c1	fix: Gespraechsmodus - strenger Speech-Gate + Crash-Prevention Probleme: - Hintergrundgeraeusche wurden als Sprache erkannt und an Whisper geschickt - App stuerzte nach laengerem Zuhoeren ab (OOM / Cache-Ueberlauf) Aenderungen: - VAD_SPEECH_THRESHOLD_DB -35 -> -28 (filtert Raum-Ambient) - VAD_SPEECH_MIN_MS 300 -> 500 (keine Huestler/Klopfer mehr) - Max-Aufnahmedauer 30s (Notbremse gegen Runaway-Loops) - _cleanupStaleCacheFiles(): alte aria_recording_/aria_tts_ Files (>30s) werden vor jeder neuen Aufnahme geloescht - ChatScreen: capMessages() begrenzt Messages-Array auf 500 Eintraege (OOM-Schutz in langen Gespraechen) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-18 12:05:15 +02:00
duffyduck	a65ed579d2	feat: Whisper model selector + 16kHz mono recording - App: AudioSamplingRateAndroid 16000 + AudioChannelsAndroid 1 → Whisper bekommt direkt sein Ziel-Format, kein Resample mehr - Bridge: STTEngine.reload() laedt Modell zur Laufzeit neu (tiny/base/small/medium/large-v3) - Bridge: Config-Message triggert Hot-Reload wenn whisperModel sich aendert - Bridge: Default auf 'medium' (besser als 'small' bei aehnlicher Latenz) - Diagnostic: Neue Sektion "Whisper (Spracherkennung)" mit Dropdown, auto-save bei Auswahl, beim Laden wird der gespeicherte Wert gesetzt - Diagnostic/Server: send_voice_config merged whisperModel in voice_config.json - aria.env.example: WHISPER_MODEL + WHISPER_LANGUAGE dokumentiert Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-18 11:37:27 +02:00
duffyduck	2ad1f57382	feat: Thinking indicator + cancel button in the app - Bridge: _emit_activity() spiegelt OpenClaw agent events als agent_activity an RVS, dedupliziert State-Wechsel. chat:final/error senden idle. - Bridge: Neuer cancel_request-Handler ruft Diagnostic /api/cancel per HTTP. - Diagnostic: Neuer POST /api/cancel Endpoint (gleiche Logik wie WS-Cancel). - RVS: agent_activity + cancel_request in ALLOWED_TYPES. - App: Gelber Indicator ueber der Input-Bar mit Text je nach Activity, roter Abbrechen-Button. Cancel sendet cancel_request via RVS. - issue.md: Erledigte Bugfixes + Features konsolidiert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-18 11:22:02 +02:00
duffyduck	58e3cfd3e6	feat: Session export as markdown in Diagnostic - ⬇ Button per Session-Zeile — exportiert auch inaktive Sessions - Server parst JSONL, extrahiert User/Assistant-Nachrichten mit Timestamp - Metadata-Prefix wird entfernt, Markdown mit # Session-Header generiert - Browser-Download via Blob + download-Attribut Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-18 11:14:15 +02:00
duffyduck	7de4ee8f5b	fix: Stuck "ARIA denkt..." indicator after pipeline ends - pipelineEnd() now broadcasts agent_activity: idle unconditionally - chat:error and chat:final paths broadcast idle outside of active pipeline - Gateway close event ends active pipeline + broadcasts idle - Prevents indicator from hanging after timeout/error/disconnect Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-18 11:11:12 +02:00
duffyduck	d6030a06b7	docs: update issue.md - move completed items, clean up open list 28 items completed, 10 remaining open Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-11 12:23:04 +02:00
duffyduck	e3a0cfb55a	docs: mark conversation mode as done, keep Porcupine as Phase 2 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-11 11:42:33 +02:00
duffyduck	51b9512f4e	docs: mark scroll bugs as fixed in issue.md Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-11 11:37:53 +02:00
duffyduck	07ed2cdcf6	docs: mark attachment text feature as done in issue.md Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-11 10:06:13 +02:00
duffyduck	8a6ee018ea	docs: mark text message bug as fixed in issue.md Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-11 09:59:48 +02:00
duffyduck	b42590ff95	docs: mark auto-update bugs as fixed in issue.md Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-11 09:54:57 +02:00
duffyduck	cd05ed2379	docs: add auto-update FileProvider bug + update check button to issue.md Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-10 08:55:30 +02:00
duffyduck	87f4317c15	docs: add auto-update APK not reaching RVS bug to issue.md Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-10 08:39:59 +02:00
duffyduck	5efc9865a8	docs: add 6 new bugs/features to issue.md - Session persistence on container restart - App: text/image/attachment messages not working (only voice) - App: audio stops randomly - App: auto-scroll to last message on start + new messages - App: add text/voice to attachments - Prioritized bugs section Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-10 08:31:49 +02:00
duffyduck	57e65b061c	docs: update issue.md with XTTS streaming as next priority Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-10 02:38:21 +02:00
duffyduck	81ca3cc7a7	Ohr-Button Absturz gefixt (LiveAudioStream entfernt, Phase 1 , Play-Button in ARIA-Nachrichten fuer Sprachwiedergabe - [x] Chat-Suche in der App (Lupe in Statusleiste) - [x] Watchdog mit Container-Restart (2min Warnung → 5min doctor --fix → 8min Restart),Abbrechen-Button im Diagnostic Chat - [x] Nachrichten Backup on-the-fly (/shared/config/chat_backup.jsonl) - [x] Grosse Nachrichten satzweise aufteilen fuer TTS - [x] RVS Nachrichten vom Smartphone gehen durch	2026-04-01 23:45:25 +02:00
duffyduck	adbb1fe80a	changed docker file	2026-03-29 17:46:27 +02:00
duffyduck	eb72b35e23	added voice settings in adroid app and diagnostic, higlight trigger in app und diagnostic change voicec	2026-03-29 17:41:28 +02:00
duffyduck	bbd02d46a6	changed issue md	2026-03-29 17:28:40 +02:00
duffyduck	8281131432	tts fix big pictures	2026-03-29 17:02:02 +02:00
duffyduck	8a6bd4e0e7	voice message are send double to diagnostic	2026-03-29 16:50:48 +02:00
duffyduck	1b4df0565a	wait at an attachment for instructions, show picture in diagnostic chat	2026-03-29 16:42:56 +02:00
duffyduck	db20a07b27	fixed time out aria-core	2026-03-29 14:56:55 +02:00
duffyduck	892c6403eb	changed .gitignore issue vreated	2026-03-29 14:09:22 +02:00

33 Commits