ARIA-AGENT

Author	SHA1	Message	Date
duffyduck	7237f05344	fix(trigger): Trigger-Antworten landen jetzt im Chat — Brain → Bridge Push Bug: Wenn der Brain-Background-Loop einen Timer/Watcher feuert, ruft er agent.chat() direkt im eigenen Prozess. Die Antwort wurde nur ins Trigger-Log geschrieben — kein RVS-Broadcast, kein TTS, nichts in App/Diagnostic sichtbar. Fix: Bridge ↔ Brain bekommen einen internen HTTP-Push-Kanal. Bridge (Port 8090, nicht exposed, nur aria-net intern): asyncio.start_server-basierter HTTP-Listener. POST /internal/trigger-fired body: {reply, trigger_name, type, events} → _handle_trigger_fired feuert Side-Channel-Events (trigger_created/skill_created/location_tracking) erst, dann _process_core_response(reply) — exakt der gleiche Pfad wie normale Chat-Antworten (Chat-Bubble + TTS + chat_backup). Brain background.py: Nach agent.chat() in _fire wird agent.pop_events() ausgelesen und zusammen mit dem Reply via urllib an aria-bridge:8090 gepostet (run_in_executor damit es den asyncio-Loop nicht blockiert). Failures werden geloggt, der Trigger selbst bleibt trotzdem als 'fired' markiert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-12 01:50:32 +02:00
duffyduck	fa47068d6d	feat(gps): kontinuierliches GPS-Tracking — Blitzer-Warner-Pipeline komplett ARIA kann jetzt GPS-Watcher mit near() effektiv nutzen: die App liefert kontinuierliche Position, Brain wertet sie in den Background-Triggers aus. rvs/server.js ALLOWED_TYPES: location_update (App→Bridge) + location_tracking (Brain→App). bridge/aria_bridge.py location_update Handler: persistiert {lat, lon} via _persist_location in /shared/state/location.json — selber Pfad wie chat/audio-events, aber als eigenes Event ohne Chat-Overhead. aria-brain/agent.py Neues Meta-Tool request_location_tracking(on, reason). Dispatcher fuegt {type: "location_tracking", on, reason} zu _pending_events hinzu → Bridge forwarded als RVS-Message zur App. aria-brain/prompts.py Trigger-Section bekam neuen Block "GPS-Watcher mit near()": ARIA wird angewiesen request_location_tracking(on=true) zu rufen wenn sie einen near()-Watcher anlegt, und wieder false beim Loeschen des letzten. android/src/services/gpsTracking.ts (NEU) Singleton-Service. start(reason) → Geolocation.watchPosition mit distanceFilter 30m + interval 15s, sendet location_update an RVS. stop(reason) → clearWatch. Persistiert Status in 'aria_gps_tracking', restoreFromStorage() beim Settings-Mount. Permission-Request fuer ACCESS_FINE_LOCATION + Toast-Benachrichtigung bei An/Aus. android/src/screens/SettingsScreen.tsx Neuer Switch im "Standort"-Block: "GPS-Tracking (kontinuierlich)" mit Hinweis-Text. Subscribe auf gpsTrackingService.onChange damit Toggle reflektiert wenn ARIA das per Tool umschaltet. RVS-Handler: location_tracking → gpsTrackingService.start/stop mit Reason aus Brain-Tool. Ablauf Stefan→ARIA→Blitzer: 1. Stefan: "Warn mich vor Blitzern auf Route nach Rhauderfehn" 2. ARIA: skill_create("blitzer-warner") falls noch nicht da 3. ARIA: run_blitzer-warner → Liste {lat,lon,name} 4. ARIA: pro Eintrag trigger_watcher mit near(lat,lon,500) 5. ARIA: request_location_tracking(on=true, reason="Blitzer-Warner aktiv") 6. App: GPS-Tracking startet, sendet alle 15s location_update 7. Bridge: /shared/state/location.json wird aktuell gehalten 8. Brain-Background-Loop: alle 30s near()-Check pro Trigger 9. Bei Erfolg: ARIA spricht "Blitzer A31 km 12 in 500m" Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-12 01:02:05 +02:00
duffyduck	07c761fc72	feat(brain): GPS-Variablen + near()-Helper + erweiterte Condition-Vars ARIA kann jetzt GPS-basierte Watcher-Trigger anlegen (Blitzer-Warner-Use-Case), plus erweiterte Time-, System- und Activity-Variablen. bridge/aria_bridge.py _persist_state() schreibt atomar nach /shared/state/<key>.json. Bei jedem chat- und audio-Event: - location → /shared/state/location.json {lat, lon, ts_unix} - last_user_ts → /shared/state/activity.json Brain-Watcher lesen das fuer die GPS- und Activity-Variablen. aria-brain/watcher.py — komplett ueberarbeitet Neue Variablen-Sets: GPS: current_lat, current_lon, location_age_sec (-1 = nie gesehen) Zeit (+): minute_of_hour, day_of_month, month, year, is_weekend, unix_timestamp System: ram_free_mb (MemAvailable), cpu_load_1min (loadavg) Activity: last_user_message_ago_sec Memory: pinned_count (zusaetzlich zu memory_count) Neue Funktion fuer Conditions: near(lat, lon, radius_m) Haversine-Distanz von current_lat/lon zum Punkt. False wenn keine Position bekannt. Parser-Erweiterung: ast.Call jetzt erlaubt, ABER nur fuer direkte Funktionsnamen aus der Whitelist (_ALLOWED_FUNCTIONS = {"near"}). Keine Attribute-Access, keine Keywords, Args nur Constants/Names/UnaryOp. Selbsttest blockt korrekt: __import__("os")... → "Funktionsaufruf nur ueber direkten Namen" memory_count.__class__ → "Verbotener Ausdruck: Attribute" (lambda: 1)() → "Funktionsaufruf nur ueber direkten Namen" aria-brain/main.py /triggers/conditions liefert jetzt zusaetzlich {functions:[...]} mit Signaturen + Beschreibungen. current-Snapshot filtert callable() raus damit JSON serialisierbar bleibt. aria-brain/prompts.py + agent.py build_triggers_section bekommt condition_funcs als 4tes Argument und listet die im System-Prompt unter "Verfuegbare Funktionen". Operatoren- Hinweis ergaenzt mit Beispielen + Regeln (keine Variablen in Funktions- Args, keine Schachtelung). diagnostic/index.html Trigger-Create-Modal: Variablen-Info-Block zeigt jetzt sowohl Variablen (mit aktuellen Werten) als auch Funktionen (Signatur + Beschreibung). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-12 00:52:13 +02:00
duffyduck	31aa86a2a9	feat(brain+ui+app): Triggers — passive Aufweck-Quellen fuer ARIA ARIA hatte bisher nur ein "User fragt → Brain antwortet"-Modell. Neu: Trigger laufen passiv im Hintergrund (kein LLM-Call) und wecken ARIA nur dann auf wenn ein Event tatsaechlich passiert. Drei Typen, zwei aktuell implementiert: timer — einmalig zu festem ISO-Timestamp ("erinner mich in 10min") watcher — Polling alle N Sek einer Condition, feuert bei True mit Throttle (z.B. "disk_free_gb < 5", max 1x/h) cron — Platzhalter fuer spaeter aria-brain/triggers.py CRUD auf /data/triggers/<name>.json + /data/triggers/logs/<name>.jsonl. create_timer, create_watcher, mark_fired, list_logs, etc. aria-brain/watcher.py Built-in Condition-Variablen: disk_free_gb, disk_free_pct, uptime_sec, hour_of_day, day_of_week, rvs_connected, memory_count. Sicherer Condition-Parser via ast — Whitelist auf Vergleich + BoolOp + Name + Const. Kein eval, kein exec, keine Builtins. aria-brain/background.py Async Loop laeuft alle 30s, sammelt einmalig Variables, geht durch Trigger-Liste, _should_fire-Check (Timer: fires_at vergangen / Watcher: check_interval + throttle respektiert + condition true). Fire ruft agent.chat(prompt, source="trigger") — ARIA bekommt das wie eine Push-Nachricht und antwortet via Bridge → RVS → App. aria-brain/main.py /triggers/list, /{name}, /{name}/logs, /timer, /watcher, PATCH, DELETE, /triggers/conditions (Variablen + aktuelle Werte). Lifespan-Handler startet den Background-Loop beim Container-Start, stoppt beim Shutdown. aria-brain/agent.py Meta-Tools fuer ARIA: trigger_timer, trigger_watcher, trigger_cancel, trigger_list. ARIA legt Trigger via Tool-Call selbst an wenn Stefan das wuenscht. Side-Channel-Event 'trigger_created' wird in chat-Response mitgeschickt damit App + Diagnostic eine Bubble zeigen. aria-brain/prompts.py Neue System-Prompt-Section: Liste aktiver Triggers + verfuegbare Condition-Variablen mit aktuellen Werten + Operatoren-Erklaerung. ARIA weiss damit immer was es schon gibt und welche Vars sie nutzen kann. bridge/aria_bridge.py + rvs/server.js trigger_created als neuer RVS-Message-Type, Bridge forwarded das aus data.events analog zu skill_created. diagnostic/index.html Neuer Top-Tab "Trigger". Liste mit Type-Badges (⏱ TIMER / 👁 WATCHER), Status, Fire-Count, last_fired. Aktivieren/Deaktivieren + Löschen pro Trigger. "+ Neu"-Modal mit Type-Dropdown, Timer-Minuten oder Watcher-Condition + Vars-Anzeige + Throttle. Info-Modal-Eintrag mit Erklaerung. Live-Bubble im Chat wenn ARIA selbst einen anlegt. android/src/screens/ChatScreen.tsx trigger_created RVS-Handler → eigene Bubble (gelber Border, "⏰ ARIA hat einen Trigger angelegt", Type/Detail/Message/Zeit). ChatMessage bekam triggerCreated-Feld. Lokal-only-Schutz beim Server-Sync analog zu skill_created. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-12 00:38:58 +02:00
duffyduck	eb4059a887	fix: 3 Bugs — agent_activity haengt, Such-Scroll, STT-Bubble-Timing Bug 1: "ARIA denkt..." in der App bleibt stehen _process_core_response setzte am Ende kein idle — die alten Aufrufe waren in der OpenClaw-WS-Loop, in der Brain-HTTP-Variante fehlten sie. Plus send_to_core schickte agent_activity direkt via _send_to_rvs ohne den _last_activity_state-Cache zu pflegen → _emit_activity("idle") wurde spaeter dedupliziert. Fix: - _emit_activity statt direktem _send_to_rvs fuer thinking - _emit_activity("idle") am Ende von _process_core_response - _last_chat_final_at bewusst NICHT setzen — die 3s-Cooldown war fuer trailing OpenClaw-Events, wuerde bei Voice die naechste thinking-Welle unterdruecken Bug 2: App Chat-Suche scrollt nicht zur Stelle scrollToIndex wurde zu fruh aufgerufen (Layout noch nicht fertig) und viewPosition: 0.4 in inverted-FlatList war ungenau. Fix: - requestAnimationFrame um den Scroll-Aufruf - viewPosition: 0.5 (mittig) - onScrollToIndexFailed: erst grob scrollen via averageItemLength, dann nach 250ms praeziser nachfassen Bug 3: Voice-Bubble bekommt STT-Text erst mit ARIA-Antwort _process_app_audio rief erst send_to_core (blockt synchron auf Brain, kann 300s dauern), DANN STT-Broadcast. App sah den eigenen Text erst wenn ARIA fertig war. Fix: Reihenfolge getauscht — STT-Broadcast zuerst, dann send_to_core. Voice-Bubble bekommt jetzt den erkannten Text sofort. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-12 00:17:10 +02:00
duffyduck	3ae9e19524	feat: Datei-Manager Multi-Select + Bulk-Download (ZIP) + Bulk-Delete Diagnostic + App bekommen Mehrfach-Auswahl im Datei-Manager. Mehr als eine Datei ausgewaehlt → Download als ZIP. Genau eine ausgewaehlt → einzeln. Bulk-Delete loescht alle markierten in einem Rutsch. diagnostic/Dockerfile zip via apk add — fuer das ZIP-Streaming im /api/files-download-zip. diagnostic/server.js POST /api/files-download-zip Body: {paths:[...]} → spawnt 'zip -j -q -', Pipes stdout in Response. Whitelist auf /shared/uploads/. POST /api/files-delete-batch Body: {paths:[...]} → loescht alle, broadcastet file_deleted pro Pfad an Browser + RVS. diagnostic/index.html filesSelected Set + Checkbox-UI pro Datei + "Alle markieren". Wenn 2+ ausgewaehlt: POST an /api/files-download-zip, Browser saugt das als Blob runter. Bei 1: normaler Single-Download. bridge/aria_bridge.py file_delete_batch_request → ruft Diagnostic /api/files-delete-batch, antwortet mit file_delete_batch_response. file_zip_request {paths,reqId} → ruft Diagnostic /api/files-download-zip, base64-kodiert, capped auf 30 MB, sendet file_zip_response. rvs/server.js ALLOWED_TYPES: file_delete_batch_request/response, file_zip_request/response. android/src/screens/SettingsScreen.tsx fileManagerSelected Set + Checkbox-UI pro Datei + "Alle markieren"-Zeile oben. Bulk-Bar oben mit count, "⬇ ZIP" / "⬇ Download" (je nach Anzahl), und "🗑 Löschen". ZIP-Response landet base64 → RNFS in Downloads-Folder (aria-files-<timestamp>.zip), Toast mit Pfad. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-11 23:30:40 +02:00
duffyduck	0ec4b00879	feat: App-Chat-Sync — verpasste Nachrichten + chat_cleared Live-Update Zwei zusammenhaengende Bugs: 1. App aktualisierte nicht wenn die Diagnostic "Konversation komplett zuruecksetzen" gedrueckt hat — die App hatte den lokalen Stand weiter 2. Nachrichten die kamen waehrend die App offline/geschlossen war, wurden nicht nachgeladen Loesung: chat_backup.jsonl wird wieder geschrieben (Bridge statt Diagnostic, weil OpenClaw-Code-Pfad tot ist) und dient als Server-Truth fuer App+Diagnostic. bridge/aria_bridge.py _append_chat_backup() schreibt jeden Turn (User + ARIA) als JSONL-Zeile in /shared/config/chat_backup.jsonl. Trigger: send_to_core (User) + _process_core_response (Assistant, inkl. file-Attachments). _read_chat_backup_since(since_ms, limit) liest die Datei, filtert auf ts > since_ms, gibt max limit neueste zurueck. Honoriert file_deleted-Marker. Neuer RVS-Handler chat_history_request {since, limit?} → antwortet mit chat_history_response {messages: [...], since}. diagnostic/server.js /api/chat-history-clear broadcastet jetzt zusaetzlich chat_cleared via RVS (sendToRVS_raw), damit App ihre lokale Liste auch leert. Vorher nur Browser-Clients via broadcast() — App war aussen vor. rvs/server.js ALLOWED_TYPES um chat_history_request, chat_history_response, chat_cleared. android/src/screens/ChatScreen.tsx - Bei (re)connect: AsyncStorage 'aria_chat_last_sync' lesen → send chat_history_request {since} - Handler chat_history_response: incoming → ChatMessage[] mappen, Attachments aus 'files'-Array rekonstruieren, mergen (Dedup via timestamp), lastSync hochziehen - Handler chat_cleared: setMessages([]) + AsyncStorage 'chat_messages' + 'last_sync' weg - Bei jeder eingehenden chat-Message: 'aria_chat_last_sync' updaten damit Reconnect nicht doppelt nachzieht Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-11 23:24:52 +02:00
duffyduck	70d1500096	feat(brain): Phase B — Vector-DB-Memory, Conversation-Loop, Skills, Tool-Use OpenClaw (aria-core) ist raus, ARIA laeuft jetzt mit eigenem Agent-Framework im aria-brain Container. Vector-DB-basiertes Gedaechtnis statt Sessions, eigener Conversation-Loop mit Hot+Cold-Memory + Rolling Window, Tool-Use fuer Skills, Memory-Destillat-Pipeline. aria-brain/ (neuer Container) - main.py FastAPI auf 8080, alle Endpoints - agent.py Conversation-Loop mit Tool-Use (skill_create + run_<skill>) - conversation.py Rolling Window, JSONL-Persistenz, Distill-Marker - proxy_client.py httpx-Wrapper zum Claude-Proxy, OpenAI-Format - prompts.py System-Prompt aus Hot+Cold+Skills - migration.py Markdown-Parser fuer brain-import/ → atomare Memories - skills.py Filesystem-Layer fuer /data/skills/<name>/ (Python-only, venv pro Skill, tar.gz Export/Import, Run-Logs) - memory/ Embedder (sentence-transformers, multilingual MiniLM) + VectorStore (Qdrant-Wrapper) docker-compose.yml - aria-core (OpenClaw) raus, openclaw-config Volume raus - aria-brain Service (FastAPI + Memory) - aria-qdrant Service (Vector-DB) mit Bind-Mount aria-data/brain/qdrant/ - Diagnostic teilt jetzt Netzwerk mit Bridge (vorher: aria-core) - Brain bekommt SSH-Mount fuer aria-wohnung + /import fuer brain-import/ bridge/aria_bridge.py - send_to_core → HTTP-Call an aria-brain:8080/chat (statt OpenClaw-WS) - aria-core-spezifische Handler raus: doctor_fix, aria_restart, aria_session_reset, Auto-Compact-Logik, OpenClaw-Handshake - Generischer container_restart-Handler (Whitelist Bridge/Brain/Qdrant) - Side-Channel-Events aus /chat-Response (z.B. skill_created) werden als RVS-Events forwarded - file_list_request / file_delete_request → an Diagnostic forwarded - Tote OpenClaw-Connection-Logik bleibt im Code als Referenz (nicht aktiv) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-11 22:23:17 +02:00
duffyduck	0b58feee1e	chore(phase-a): aria.env + OpenClaw-specific configs raus, Brain-Backup angelegt Vorbereitung fuer Bridge-als-Agent (OpenClaw raus). Phase-A-Cleanup: - aria-data/brain-import/ angelegt — System-Prompt-Files BOOTSTRAP.md + AGENT.md + USER.md.example + TOOLING.md.example dort archiviert. Werden vom neuen Agent-Framework spaeter importiert. - aria-data/config/aria.env + .example geloescht (alle Eintraege waren tot oder via runtime.json/Hardcode-Default abgedeckt) - aria-data/config/openclaw.env + openclaw-auth.json geloescht (Provider-Config landet im Bridge-Code) - docker-compose: AGENT/BOOTSTRAP/USER/openclaw.env-Mounts aus aria-core raus; aria.env-Mount aus bridge raus; COMPACT_AFTER_MESSAGES env raus (kommt jetzt aus runtime.json) - bridge: CONFIG_PATH-Lesen aus /config/aria.env entfernt, load_config nutzt nur noch runtime.json; _compact_after liest compactAfterMessages aus runtime.json (Default 140) - diagnostic: Eingabefeld "Compact nach Messages" in Runtime-Config-UI; load/save schreiben/lesen compactAfterMessages - init.sh: nur noch .env-Bootstrap (Rest landet eh in runtime.json/DB) ARIA antwortet im Phase-A-Status ohne ihre Persoenlichkeit (System-Prompt nicht mehr gemountet, "raw Claude" durch Proxy) — das ist Absicht und Uebergang bis das neue Gehirn live ist. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-11 20:13:54 +02:00
duffyduck	0f11d23c75	fix(bridge): User informieren wenn ARIA Marker fuer nicht-existente Datei setzt Bridge-Logs zeigten: ARIA setzt zwei Marker (aria_rave2.mid und .mp3), hat die .mid aber nie wirklich erstellt. Bridge filterte sie silent → Stefan sah nur eine Bubble und dachte das Marker-System ist kaputt. Jetzt: _extract_file_markers gibt auch eine Liste der "missing"-Pfade zurueck, und im Antworttext steht ein Hinweis-Block fuer den User welche Files versprochen aber nicht erstellt wurden. Plus System-Prompt geschaerft: ARIA soll vor dem Marker pruefen ob das File wirklich existiert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-11 18:41:22 +02:00
duffyduck	4082a6bf2a	feat: Auto-Compact nach N User-Messages — verhindert E2BIG bei langer Session E2BIG (Argument list too long) tritt auf wenn aria-core's Subprocess- Spawn das Linux argv-Limit (~128KB-2MB) sprengt. Bei >140 Messages samt Memory + System-Prompt + Tools laeuft das voll, ARIA antwortet nur noch leer auf jede Anfrage. Bridge zaehlt jetzt User-Nachrichten in send_to_core; bei COMPACT_AFTER_MESSAGES (env, default 140) wird automatisch: - Sessions geleert (rm sessions/*.jsonl + sessions.json = {}) - aria-core neu gestartet - User informiert "Konversation komprimiert, letzte Nachricht nochmal" Plus manueller "🧹 Konversation komprimieren"-Button in App-Settings und 🧹 Compact-Button in Diagnostic-Thinking-Indicator. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-11 02:24:30 +02:00
duffyduck	2dd4d38dce	feat: "ARIA hart neu starten"-Button (docker restart aria-core) Zweiter Eskalations-Button neben dem Reparieren-Button — fuer Faelle wo doctor --fix nicht reicht (Run alive aber haengt im Tool-Call). Mit Confirmation-Dialog damit's nicht versehentlich gedrueckt wird. Wege: - App-Settings: Reparatur-Sektion, zwei Buttons (Reparieren + Hart neu) - App-Thinking-Bubble: 🔧 + 🚨 + Abbrechen - Diagnostic-Thinking-Indicator: 🔧 + 🚨 + Abbrechen - Diagnostic-Server: POST /api/aria-restart → child_process exec `docker restart aria-core` - Bridge: rvs aria_restart → HTTP zu Diagnostic Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-11 01:58:44 +02:00
duffyduck	528fe97b59	feat: "ARIA reparieren"-Button in App + Diagnostic Bei stuck OpenClaw-Runs (ARIA antwortet nicht mehr / "Antwort ohne Text" auf jede Anfrage) kann der User jetzt selbst openclaw doctor --fix anstossen — ohne SSH/docker exec. Pfad: - App-Button → rvs.send('doctor_fix') → Bridge → HTTP POST an Diagnostic /api/doctor-fix → dockerExec aria-core - Diagnostic-Button → direkt HTTP POST /api/doctor-fix Zwei Plaetze in der App: oben in der Thinking-Bubble (wenn ARIA denkt aber haengt) und in Settings → Reparatur (immer erreichbar). In Diagnostic neben dem Abbrechen-Button im Thinking-Indicator. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-11 01:46:35 +02:00
duffyduck	3b19f05c5b	feat: ARIA kann Dateien an User zurueckgeben (PDFs, Bilder, Office-Docs, ...) ARIA setzt im Antworttext einen Marker `[FILE: /shared/uploads/aria_xxx.ext]`. Bridge extrahiert ihn (Marker wird aus dem TTS-Text entfernt) und sendet ein neues file_from_aria-Event ueber RVS an App + Diagnostic. Diagnostic: - Eigene Bubble mit Datei-Icon + Klick-Handler - PDF/Bild → neuer Browser-Tab via /shared/* HTTP-Route - Andere → Download via download-Attribut App: - Neues FileOpenerModule (Kotlin) — Intent.ACTION_VIEW mit FileProvider, Android-Picker waehlt App nach MIME-Type - file_paths.xml erweitert (cache + files + external) - file_response liefert jetzt mimeType mit - Klick auf ARIA-Anhang: lokal vorhanden → direkt oeffnen, sonst file_request mit autoOpen-Flag → bei Empfang persistAttachment + open Stefan muss noch im aria-core/OpenClaw System-Prompt einen Hinweis einbauen: "Wenn du dem User eine Datei erstellt hast (Pfad in /shared/uploads/), haenge am Ende deiner Antwort einmalig [FILE: /shared/uploads/aria_<name>.<ext>] an. Der Marker wird aus dem sichtbaren Text entfernt und als Anhang in App und Diagnostic angezeigt." Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 17:56:47 +02:00
duffyduck	b3ff3991c4	feat(bridge): Bilder >2MB serverseitig auf 1568px verkleinern Claude-Vision-API hat ~5MB Base64-Limit. Stefan's 4MB Foto via Buroklammer (DocumentPicker) sprengte das, Claude lieferte leere Antwort zurueck. Galerie-Pfad ging weil react-native-image-picker schon clientseitig komprimiert. Bridge resized jetzt JPEG/PNG/WebP/GIF >2MB auf max 1568px lange Seite (Anthropic-Empfehlung), JPEG q=85. SVG, PDF, ZIP, Office-Docs bleiben unangetastet — die laufen ueber Tools, nicht Vision. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 16:15:05 +02:00
duffyduck	a4ea387c98	fix(bridge): "chat final ohne Text" wird sichtbar an App gemeldet Wenn Claude-Vision das Bild silent ablehnt (z.B. zu gross), kommt phase=end ohne Crash, aber chat:final ohne text. Bridge ignorierte das nur mit Warning — App wartete ewig auf Antwort. Jetzt kommt eine Hinweis-Bubble damit der User weiss dass was schief lief. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 16:11:14 +02:00
duffyduck	68fbf74a23	fix(bridge): chat:error liest auch errorMessage — kein "Unbekannt" mehr OpenClaw legt bei state=error den Text in errorMessage statt error. Bridge ignorierte das und meldete generisches "[Fehler] Unbekannt" an App + Diagnostic — der echte Text ("Process exited with code 1" etc) ging nur in die Container-Logs. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 16:07:20 +02:00
duffyduck	ef1a4436ca	fix(bridge): WebSocket max_size auf 50MB — grosse Bilder/Uploads gehen wieder Python websockets Default-Limit ist nur 1 MiB. Stefan's 4MB JPEG (5.8MB als Base64) sprengte das, Bridge-Verbindung wurde silent gedroppt. App sah nichts, Diagnostic kriegte kein file_saved, ARIA reagierte nicht — Kamera- Bilder waren klein genug (<1MB) und gingen darum durch. f5tts/whisper-bridges hatten max_size=50MB schon drin, nur aria_bridge hatte's an beiden websockets.connect-Stellen vergessen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 15:42:48 +02:00
duffyduck	910e74b497	fix(bridge): GPS-Position auch im STT-chat-Payload an Diagnostic mitgeben Die App sendet location einmal im audio-Payload. Die Bridge kannte sie zwar (ging in aria-core's Kontext rein), reichte sie aber nicht im STT- broadcast an die Diagnostic durch. Diagnostic zeigte darum bei Sprach- eingaben nie den GPS-Block. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 14:59:09 +02:00
duffyduck	0c18090351	chore: Highlight-Trigger raus + letzte Piper-Reste aufgeraeumt Highlight-Trigger: - diagnostic/index.html: Settings-Sektion + Trigger-Liste-Handler raus - diagnostic/server.js: get_triggers / save_triggers Action-Handler + TRIGGERS_FILE Konstante + handleGetTriggers/handleSaveTriggers Funktionen weg - README.md: highlight_triggers.json aus dem Datenverzeichnis-Diagram entfernt Die Auswertung war seit Piper-Removal eh tot — die Datei wurde nur noch geschrieben aber nirgends gelesen. Piper-Reste: - bridge/aria_bridge.py: Modul-Docstring auf F5-TTS aktualisiert, Ramona/Thorsten-Erwaehnungen raus, Inline-Kommentar zu "Komponenten TTS" gefixt - aria-data/config/AGENT.md: Stimmen-Tabelle (Ramona/Thorsten) durch Hinweis auf F5-TTS Voice-Cloning ersetzt - aria-data/config/BOOTSTRAP.md: gleiche Tabelle weg, Bridge-Beschreibung auf "orchestriert STT/TTS via Gamebox-Bridges" geaendert Erledigt-Eintraege in issue.md + README markiert (historisch erhalten). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 23:47:55 +02:00
duffyduck	e0c1a4bcd5	feat: GPS-Position bei jeder Nachricht an aria-core (still, nur bei Bedarf) App: GPS-Toggle in Settings → Allgemein → Standort wird jetzt korrekt in AsyncStorage persistiert (key: aria_gps_enabled). ChatScreen pollt den Wert mit den anderen Settings im 2s-Intervall. Bridge: chat/audio-Handler nutzen jetzt einen gemeinsamen _build_core_text Helper, der je nach Kontext einen Hint vorschaltet: - Barge-In ("[Hinweis: Stefan hat dich unterbrochen ...]") - GPS ("[Stefans aktuelle GPS-Position: lat, lon. Nutze die nur wenn die Frage sich auf seinen Standort bezieht. Erwaehne sie nicht von dir aus, ausser er fragt explizit danach.]") ARIA weiss bei "wo bin ich?" / "Wetter hier?" automatisch was zu tun ist — bei normalen Fragen kommt die Position aber nicht ungefragt vor. Der User sieht im Chat-Verlauf nichts von der GPS-Info, nur ARIAs Antwort kann darauf eingehen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 23:29:34 +02:00
duffyduck	77e927ffcd	fix(audio): Placeholder-Race per audioRequestId + Mikro-Offen-Toast erst nach Start Bug: Bei zwei Sprachnachrichten kurz hintereinander wurde der STT-Text der zweiten in die Bubble der ersten geschrieben. Ursache: findIndex matchte ueber Substring "Spracheingabe wird verarbeitet" → bei zwei offenen Placeholders nahm er immer die ERSTE, egal welches STT-Result gerade kam. Fix: jede Aufnahme bekommt eine eindeutige audioRequestId, App pusht sie in die Placeholder-Bubble + ans audio-Event. Bridge gibt sie unveraendert ans STT-Result zurueck. App matcht primaer per ID, fallback auf Substring (Kompatibilitaet zu alten Bridge-Versionen). Bonus: Toast "Wake-Word erkannt" entfernt, dafuer "🎤 Mikro offen — sprich jetzt" erst wenn audioService.startRecording wirklich erfolgreich war. So weiss der User exakt ab wann er reden darf — vorher war der Toast schon ~400ms vorher da. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 22:33:26 +02:00
duffyduck	31ff20c846	feat: Max-Aufnahmedauer konfigurierbar + Barge-In gibt aria-core Kontext Max-Aufnahme: Default rauf von 2 auf 5 Minuten, in den App-Settings konfigurierbar zwischen 1 und 30 Minuten (loadMaxRecordingMs aus AsyncStorage, Storage-Key aria_max_recording_sec). Notbremse-Verhalten bleibt: nach Ablauf wird die Aufnahme automatisch beendet und gesendet. Barge-In Kontext: Wenn der User waehrend ARIA noch redet/arbeitet eine neue Sprach- oder Text-Nachricht sendet, geht jetzt ein 'interrupted: true' Flag mit. Bridge praefixed den Text fuer aria-core dann mit: "[Hinweis: Stefan hat dich gerade unterbrochen waehrend du noch gesprochen oder gearbeitet hast. Folgendes ist eine Korrektur, Ergaenzung oder ein Themenwechsel zu deiner letzten Antwort.]" So weiss ARIA dass die neue Message KEINE eigenstaendige Folgefrage ist sondern auf den abgebrochenen Run bezogen. Der User sieht in seinem Chat nur den reinen Text — der Hint geht nur an aria-core. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 21:58:11 +02:00
duffyduck	f55329706e	debug(stt): Toasts in App + Bridge-Log fuer STT-Broadcast-Erfolg Da kein adb-Zugriff: visuelle Debug-Pfade direkt in der App + im Diagnostic-Bridge-Tab. App: zwei Toasts beim Empfang eines stt-events - "STT empfangen: ..." sobald das chat-event mit sender=stt reinkommt - "Bubble #X ersetzt" oder "keine Placeholder → neue Bubble" Bridge: explizites Info-Log "STT-Text an RVS broadcastet (sender=stt)" nach erfolgreichem _send_to_rvs, "NICHT broadcastet" wenn die Methode False lieferte (Ping fehlgeschlagen / Verbindung tot). Naechster Test: - Sprachnachricht aufnehmen - Toast erscheint? → STT-Event kommt in App an, Bug ist im findIndex - Toast erscheint nicht? → Diagnostic Bridge-Tab pruefen ob das Log "STT-Text an RVS broadcastet" steht Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 20:29:26 +02:00
duffyduck	20123de827	fix: Sprachnachricht-Bubble defensiv + Bild+Text als eine Anfrage Bug 2: STT-Result schreibt jetzt eine neue User-Bubble wenn keine Placeholder im State gefunden wird (statt das Update zu verwerfen). Schuetzt vor Race-Conditions zwischen audio-send und State-Updates, damit der gesprochene Text immer im Chat erscheint. Bug 3: Bild + Text wurden als zwei getrennte Events ('file' + 'chat') gesendet, jeder triggerte einen eigenen send_to_core. ARIA antwortete zweimal — einmal "warte auf Anweisung" beim Bild, dann nochmal auf den Text. Bridge buffert jetzt eingehende file-Events 800ms; kommt in dem Fenster ein chat, werden alle Files + Text zu einer einzigen aria-core-Nachricht gemerged. Kein chat → Files alleine wie bisher. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-03 21:40:15 +02:00
duffyduck	abc5b971f4	fix(voice): Stimmen-Wechsel greift wieder — Override bleibt bis naechster Chat-Event Bug: Voice-Override wurde nach der ersten ARIA-Antwort konsumiert. Eine ARIA-Antwort triggert aber oft mehrere TTS-Calls (Tool-Use → Zwischenmeldung → finale Antwort). Der erste nutzte die neue Stimme, alle folgenden fielen auf self.xtts_voice (= alte Voice aus voice_config.json) zurueck. Die App schickt nie ein config-Update, daher blieb voice_config.json fuer immer auf der alten Stimme. Neue Semantik: - chat-/audio-Event mit voice="X" → Override="X", gilt fuer alle folgenden TTS-Calls bis zum naechsten chat-Event - chat-Event mit voice="" → Override geloescht, fallback auf Default-Voice (voice_config.json / Diagnostic) - chat-Event ohne voice-Field → Override unveraendert Audio-Send in ChatScreen.tsx (Push-to-Talk-Pfad) gab voice/speed gar nicht mit; jetzt konsistent mit dem Tap-to-Talk-Pfad. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-26 20:04:19 +02:00
duffyduck	bbf9aed3ba	fix: 4 Bugs — STT-Mapping, Speed-Logging, VAD-Logs, Wake-Word-Toast Bug 2: STT-Result ueberschrieb beide noch unaufgeloeste Audio-Bubbles mit gleichem Text. Fix: nur die ERSTE matchende Bubble aktualisieren (findIndex + index-Update statt map). Reihenfolge ist FIFO weil Whisper sequenziell verarbeitet. Bug 3: Speed-Param wird nun in jedem Hop geloggt: - ChatScreen: "[Chat] sende mit voice=X speed=Y" - aria-bridge: "XTTS-Request gesendet (voice=X, speed=Y.YYx)" - f5tts-bridge: "F5-TTS: N Satz(e), voice=X, speed=Y.YYx" Damit kann man im logcat/docker-logs eindeutig sehen wo speed evtl. verloren geht oder ob die Stimme einfach von Natur aus schnell ist. Bug 4: VAD-Trigger-Reason mit Schwelle: "VAD NNN ms Stille (Schwelle=NNN ms)". Plus startRecording loggt jetzt VAD-Stille + MAX-Recording. Bug 1 (Porcupine): mehr Debug + Toast-Meldungen. - init failure: err.name/code/stack ins Log - start() ohne Porcupine: Toast "Access Key in Settings setzen" - start() Fehler: Toast mit Fehlermeldung - configure(): Toast wenn init scheitert - Erfolgreiches arming: Toast "Lausche auf X" Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 20:28:46 +02:00
duffyduck	e7bb6c37cb	feat: Sprechgeschwindigkeit-Range auf 0.1-5.0 erweitert TTS_SPEED_MIN 0.5 → 0.1, TTS_SPEED_MAX 2.0 → 5.0. Bridge-seitige Validierungen (aria_bridge.py + f5tts/bridge.py) mit- gezogen auf den gleichen Bereich. Hinweis: Extremwerte (unter 0.5 oder ueber 2.0) koennen bei F5-TTS verzerrte Ausgaben produzieren — Stefan bekommt die Freiheit zum Experimentieren. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 00:49:05 +02:00
duffyduck	190352820c	feat: Bug-Runde + 5 App/Diagnostic-Features Bugs: - App Mute-/Auto-Playback: onMessage-Closure hielt stale ttsDeviceEnabled/ ttsMuted → Mute wurde ignoriert + AsyncStorage-Load kam nicht durch. Fix via ttsCanPlayRef (live gespiegelt) statt Closure-Variablen. - App Zombie-Recording: toggleWakeWord hat die laufende Aufnahme nicht gestoppt → audioService.recordingState blieb 'recording' → normaler Aufnahme-Button wirkungslos. Fix: await stopRecording() vor stop(). - Porcupine robuster: BuiltInKeywords-Enum Mapping mit String-Fallback, errorCallback fuer Runtime-Crashes (state zurueck auf off statt App-Crash), mehr Logging damit man beim naechsten Issue debuggen kann. App-Features: - MessageText Komponente: Text ist durchgehend selektierbar, erkennt URLs (http/https), E-Mails, Telefonnummern und macht sie anklickbar (oeffnet Browser / Mail-App / Android-Dialer via Linking). - TTS-Wiedergabegeschwindigkeit pro Geraet einstellbar (Settings -> "Sprechgeschwindigkeit", 0.5-2.0 in 0.1-Schritten, Default 1.0). Wird als speed-Param an die F5-TTS-Bridge durchgereicht. Bridge-Durchreichen: - ChatScreen: speed aus AsyncStorage via ttsSpeedRef, an chat/audio/ tts_request mitgeschickt - aria-bridge: _next_speed_override wie voice_override, an xtts_request weitergereicht - f5tts-bridge: speed-Param an F5TTS.infer() durchgereicht Diagnostic-Feature: - Voice-Preview-Button (Play-Icon) vor dem Delete-X in der Stimmen-Liste - Modal mit Textfeld (Default-Beispieltext wird bei jedem Oeffnen neu gesetzt) und Play-Button - Server sammelt audio_pcm Frames der Preview-Anfrage, baut WAV, schickt base64 zurueck, Browser spielt im <audio>-Tag ab - 60s Timeout-Safety-Net Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 00:24:02 +02:00
duffyduck	744a27cfd1	fix: HF-Cache zurueck + Banner-Bug + config_request Pattern Vier Bugs in einem Aufwasch: 1. HF-Cache als Bind-Mount zurueck xtts/hf-cache:/root/.cache/huggingface fuer beide Bridges. War vorher raus, dadurch jedes Container-Restart = ~3GB Whisper-Download + ~1GB F5-TTS-Download. User dachte 5min ist einmalig — ist aber bei jedem Restart. Jetzt: einmal pro Maschine geladen, fertig. 2. Banner zeigte stale "ready" whisper-bridge sendete beim Connect nur dann Status wenn Modell schon geladen war. Sonst blieb der App/Diagnostic Banner auf dem alten "ready" State von vor dem Restart haengen — User sah "bereit" obwohl gerade gar nichts geladen war. Jetzt wird IMMER ein Status broadcast: ready oder loading. 3. config_request Pattern aria-bridge wusste nicht wann Gamebox-Bridges sich (re)connecten. Wenn die nach aria-bridge kamen, verpassten sie den Config-Broadcast und blieben mit Hard-Defaults stehen. Jetzt: whisper- und f5tts-bridge senden beim Connect ein config_request, aria-bridge antwortet mit der persistierten Config (whisperModel, xttsVoice, f5tts*-Felder). 4. RVS ALLOWED_TYPES um config_request erweitert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 17:46:47 +02:00
duffyduck	37c5f6c368	fix: dynamischer STT-Timeout — whisper Modell-Download nicht abkappen aria-bridge horcht jetzt auf service_status fuer den Service 'whisper'. Solange whisper-bridge im 'loading' steckt (Erst-Download large-v3 kann 1-2 Min dauern), gilt fuer stt_request ein Timeout von 300s statt 45s. Sobald 'ready', zurueck auf 45s — reicht selbst fuer lange Audios. Symptom vorher: Beim ersten Sprechen nach Container-Restart hat aria- bridge nach 45s aufgegeben und lokal gefallback waehrend whisper-bridge noch fleissig den Download laufen hatte. Damit wurde der Sinn der Auslagerung kaputt gemacht. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 17:06:04 +02:00
duffyduck	187ffad7ee	feat: F5-TTS Tuning ueber Diagnostic statt .env Folgt der "keine neuen Settings in .env" Regel. f5tts/bridge.py: - F5TTS_MODEL/CKPT_FILE/VOCAB_FILE/CFG_STRENGTH/NFE_STEP ENV-Vars raus - Hard-coded Defaults im Code (DEFAULT_F5TTS_) - F5Runner besitzt Live-Settings als Instance-Vars + update_config() - config-Broadcast triggert Modell-Reload nur wenn Modell-relevantes sich aendert (cfg_strength/nfe_step ohne Reload) - F5TTS_DEVICE bleibt ENV (Hardware-Bootstrap) xtts/docker-compose.yml: F5TTS_ ENV-Vars rausgenommen, Kommentar verweist auf Diagnostic-Config. aria-bridge: nimmt f5tts*-Felder im config-Handler entgegen, persistiert sie in voice_config.json. Beim RVS-Connect broadcastet die Bridge die persistierte Config einmalig — damit die f5tts-bridge nach Container- Restart automatisch die zuletzt gewaehlten Settings bekommt, ohne dass der User in Diagnostic was klicken muss. Diagnostic UI: - Neuer aufklappbarer "F5-TTS Modell-Tuning (advanced)" Bereich - Felder: Modell-ID, Custom-Checkpoint, Vocab, cfg_strength, nfe_step - voice_config beim Laden: Felder werden zurueck in die UI gesetzt - sendVoiceConfig schickt die neuen Felder mit - Server: send_voice_config persistiert die Felder, leere Strings werden geloescht damit die Hard-Defaults greifen Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 15:44:58 +02:00
duffyduck	e170991222	fix: _send_to_rvs gibt Success-Bool zurueck, _stt_remote bricht bei Send-Fehler sofort ab statt in den 45s-Timeout zu laufen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 14:16:08 +02:00
duffyduck	a1343ee18f	debug: Logs beim stt_request-Roundtrip — aria-bridge loggt beim Senden, whisper-bridge loggt eingehende stt_request (id + Audio-Groesse). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 14:13:41 +02:00
duffyduck	e544992c9f	feat(phase1): Whisper STT auf die Gamebox ausgelagert Neuer Container aria-whisper-bridge auf der Gamebox — faster-whisper CUDA mit float16. Der Container verbindet sich per WebSocket an den RVS, nimmt stt_request entgegen, laeuft ffmpeg+Whisper, antwortet mit stt_response. Hoert zusaetzlich auf config-Broadcasts und lädt das Modell hot-swap bei Diagnostic-Wechsel. aria-bridge ruft jetzt primaer die Gamebox an; nur wenn die nicht binnen 45s antwortet, faellt auf lokales Whisper (CPU) zurueck. Das lokale Modell wird lazy geladen, spart RAM auf der VM. RVS: stt_request/stt_response zur ALLOWED_TYPES-Liste. Diagnostic-Voice-Config (whisperModel-Feld) bleibt unveraendert — die Auswahl wird an die Gamebox durchgereicht. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 13:42:07 +02:00
duffyduck	c042f27106	feat: generisches Buchstabieren fuer unbekannte Akronyme Nach der expliziten _UNIT_WORDS-Liste greift eine Fallback-Regel: alle verbleibenden 2-5-Zeichen-Grossbuchstaben-Woerter werden buchstabiert. XTTS → X T T S, USB → U S B, DNS → D N S, JSON → J S O N. Spezielle Faelle (WLAN, NATO — als Wort gesprochen) koennen bei Bedarf in _UNIT_WORDS explizit ueberschrieben werden. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-22 19:17:04 +02:00
duffyduck	23c39d5bba	feat: Dezimalzahlen fuer TTS ausschreiben + Leading-Silence im Stream - aria_bridge clean_text_for_tts: "0.1" / "0,5" / "1,25" wird jetzt als "null komma eins" / "null komma fuenf" / "eins komma zwei fuenf" ausgeschrieben. Lookahead verhindert Match auf IP-artige Strings. - PcmStreamPlayer: 200ms Stille am Stream-Anfang, damit AudioTrack sauber anfaehrt und die ersten Worte nicht verschluckt werden. (XTTS-Warmup + play()-Startup-Latenz) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-22 18:44:38 +02:00
duffyduck	350069d371	fix: Streaming TTS — doppeltes Audio + Gaps zwischen Saetzen Zwei Probleme gefunden: 1) DOPPELTES AUDIO (Kern-Ursache der Artefakte) aria-bridge hat audio_pcm von XTTS-Bridge empfangen und per _send_to_rvs rebroadcastet. RVS broadcast geht an ALLE Clients ausser Sender — die App bekam jeden Chunk also zwei mal: XTTS-Bridge → RVS → App + aria-bridge aria-bridge → RVS → App (nochmal!) + XTTS-Bridge Zwei ueberlagerte PCM-Streams klingen wie Doubled/Artefakte. Fix: aria-bridge ignoriert audio_pcm jetzt. messageId schickt XTTS-Bridge selbst im Payload (via xtts_request -> messageId). 2) GAPS ZWISCHEN SAETZEN (abgehackt) xtts/bridge.js teilte Text in ~150-char Chunks und rief pro Chunk einen eigenen /tts_to_audio/ Request. Zwischen Chunks lag die XTTS-Render-Zeit (1-3s) → hoerbare Pausen. Fix: cleanText geht JETZT in einem Request komplett an XTTS. Ein zusammenhaengender Stream → keine Satz-Gaps mehr. Kompromiss: Erste Samples kommen spaeter (ganze Text-Render dauert laenger als der erste Satz alleine), aber dann kontinuierlich ohne Unterbrechung. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 23:15:57 +02:00
duffyduck	d411df4074	feat: Mode-Wechsel auch aus Diagnostic global syncronisiert Vorher: Diagnostic's setMode sendete einen faked chat mit der Aktivierungsphrase ('ARIA, Hangar-Modus') — das wurde erst in _process_core_response auf dem ARIA-Antwort-Text detected, war unzuverlaessig und nutzte nicht den sauberen mode-Message-Path. Nachher: sauberer set_mode-Pfad mit Live-Sync. diagnostic/server.js: - Neue action 'set_mode' → sendet type=mode an RVS direkt - RVS-Message-Handler: type=mode Broadcast von Bridge wird an Browser-Clients durchgereicht diagnostic/index.html: - setMode() nutzt jetzt action=set_mode (keine Phrase mehr) - updateModeUI separat — wird bei Broadcast auch aufgerufen - Mode-Broadcast vom Server syncs UI live (andere Diagnostic/App hat gewechselt → unser UI aktualisiert sofort) - Button data-mode + MODE_LABELS auf kanonische IDs umgestellt (nicht_stoeren, fluester statt dnd, whisper) bridge/modes.py: - canonical_id() liefert die IDs die App + Diagnostic kennen (nicht_stoeren, fluester, ...) — damit Broadcast-ID zur UI-ID passt bridge/aria_bridge.py: - _broadcast_current_mode nutzt canonical_id statt enum.name.lower() Flow jetzt: Diagnostic wechselt Mode → set_mode → Bridge → persist + broadcast → alle Apps + alle Diagnostic-Browser-Tabs aktualisieren sofort Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 22:57:41 +02:00
duffyduck	763e0d79ab	feat: Betriebsmodus global + persistent + Live-Sync Vorher: - Modus war nur in-memory in der Bridge, Restart = zurueck auf NORMAL - App-Wechsel wurde zwar empfangen, aber nicht an andere Geraete gebroadcastet (nur Bestaetigung an den Sender) - Neue App-Verbindung wusste nicht welcher Modus gerade aktiv ist Jetzt: - Persistiert in /shared/config/mode.json beim Wechsel - Beim Bridge-Start: _load_persisted_mode() holt letzten aktiven Modus - _broadcast_current_mode() sendet an ALLE Clients (Broadcast) — jedes verbundene Geraet bekommt live den Wechsel mit - Bei RVS-Reconnect: sofortiger Broadcast damit neu verbundene Apps/ Diagnostic ihre UI syncen koennen - Loop-Schutz: payload.sender=="bridge" wird im mode-Handler ignoriert (sonst echo → Broadcast-Storm bei verbundenem RVS) Beispiel-Flow: Geraet A aktiviert 'Hangar' → Bridge empfaengt mode-msg → persist in mode.json → broadcast an alle Clients (mit sender="bridge") → Geraet B/C/Diagnostic empfangen → UI updated sofort → Bridge-Restart spaeter: HANGAR wird wieder geladen Anmerkung zu echten OS-Push bei geschlossener App: Das braucht FCM/Firebase + BackgroundService — deutlich mehr Arbeit, ist separat als Feature fuer spaeter zu sehen. Live-Sync bei geoeffneter App (WebSocket verbunden) funktioniert jetzt zuverlaessig. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 22:53:47 +02:00
duffyduck	47fe4ad655	fix: Modus-Wechsel via App/ID funktioniert jetzt Bug: App ModeSelector sendet rvs.send('mode', { mode: 'normal' }) mit ID, Bridge's detect_mode_switch() sucht aber nach Aktivierungs- phrasen wie 'aria, normal-modus' → kein Match → Modus-Wechsel wurde ignoriert, TTS-Verhalten blieb auf NORMAL haengen. Fix: - modes.py: mode_from_id() mappt IDs zu Mode-Enum ('normal', 'dnd', 'nicht_stoeren', 'fluester', 'whisper', 'hangar', 'gaming' — flexibel) - aria_bridge.py: mode-Handler versucht erst ID-Mapping, dann Phrasen-Erkennung als Fallback - Unbekannte Modi werden geloggt - Bestaetigung wird an alle Clients zurueckgesendet damit App-UI synchron bleibt Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 22:51:18 +02:00
duffyduck	99cb83202e	feat: App XTTS-Voice-Auswahl + Aufnahme + Loeschen (geraetelokal) App Settings: Voice-Sektion (nur wenn TTS an) - Liste aller XTTS-Server-Stimmen mit Auswahl-Radio + X zum Loeschen - 'Standard' fuer Diagnostic-Default-Voice (keine lokale Ueberschreibung) - 'Aktualisieren' Button laedt Liste neu (xtts_list_voices via RVS) - 'Eigene Stimme aufnehmen' oeffnet VoiceCloneModal VoiceCloneModal: 30s Aufnahme + Upload - Vorlese-Text (>30s Lesedauer, thematisch passend) - Rot-pulsierender Stop-Button, live Timer + Progressbar - Auto-Stop bei 30s, Hinweise ab 15s ('genug fuer gute Clonung') - Nach Stop: Namenseingabe (a-Z, 0-9, _, -), Upload via voice_upload - Nach Upload: Modal schliesst, Settings bekommt xtts_voice_saved und setzt automatisch die neue Stimme als gewaehlt Voice-Flow App → Bridge → XTTS (geraetelokal): - Jeder chat/audio/tts_request schickt aria_xtts_voice (AsyncStorage) mit der Message mit - Bridge speichert _next_voice_override bei chat/audio Empfang, nutzt es fuer die naechste ARIA-Antwort und resettet dann - Fallback: globale xtts_voice aus voice_config.json (Diagnostic) Ergebnis: - Gerat A hat 'stefan' geclont → ARIA antwortet Geraet A mit stefan - Gerat B hat nichts gewaehlt → ARIA antwortet Geraet B mit Default - Diagnostic-Einstellung wirkt als fallback-default fuer neue Geraete Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 22:48:24 +02:00
duffyduck	fc2438be2d	fix/feat: XTTS-Voice korrekt persistiert, Loeschen + Voice-per-Request Bug-Fix: Voice-Auswahl verschwand nach Page-Load - xtts_voices_list Handler rebuildet das Dropdown — vorheriger select.value ging dabei verloren. Jetzt wird der Wert gemerkt und nach Rebuild wiederhergestellt (falls die Stimme noch existiert). Feature: Stimmen loeschen (Diagnostic) - XTTS-Bridge: neuer handleDeleteVoice — entfernt /voices/<name>.wav und schickt aktualisierte Liste per xtts_voices_list - RVS: xtts_delete_voice in ALLOWED_TYPES - Diagnostic Server: Action xtts_delete_voice forwarded via RVS - Diagnostic UI: renderVoiceList zeigt alle Custom-Voices mit X-Button Bei Loeschen der gerade aktiven Stimme: auf Default zuruecksetzen Feature: Voice-per-Request in Bridge - App kann mit jedem Chat ein voice-Feld mitschicken - Bridge merkt sich _next_voice_override, nutzt es fuer die NAECHSTE ARIA-Antwort (einmalig, dann reset) - tts_request (Play-Button) akzeptiert voice im Payload als Override - Fallback: globale xtts_voice aus voice_config.json - So kann jedes Geraet seine eigene Stimme haben ohne den globalen Default zu aendern Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 22:43:26 +02:00
duffyduck	f801d99748	feat: Piper komplett entfernt — nur noch XTTS v2 als TTS Breaking Change: wenn XTTS-Bridge (Gaming-PC) offline ist, bleibt ARIA stumm. Chat-Antworten kommen weiter an, aber kein Audio. Das ist bewusst akzeptiert — XTTS klingt einfach grauenhaft viel besser. Bridge (aria_bridge.py): - from piper import ... raus - VoiceEngine-Klasse komplett entfernt (synthesize, speak, select_voice) - EPIC_TRIGGERS + load_epic_triggers raus (Highlight-Voice-Feature ohne Piper sinnlos) - self.voice_engine, voice_name, requested_voice Aufrufe weg - _process_core_response: immer XTTS, kein Fallback - tts_request Handler: immer XTTS - config Handler: nur ttsEnabled + xttsVoice + whisperModel - import wave raus bridge/requirements.txt: piper-tts raus bridge/Dockerfile: Kommentar aktualisiert docker-compose.yml: ./aria-data/voices Mount raus aria-data/config/aria.env.example: PIPER_RAMONA/PIPER_THORSTEN raus get-voices.sh: komplett geloescht (war nur Piper-Downloader) Diagnostic UI (index.html): - Piper Panel (Standard-Stimme / Highlight-Stimme / Speed-Sliders) weg - TTS Engine Dropdown weg (immer XTTS) - TTS Diagnose Tab zeigt nur noch XTTS-Status + Test-Button - sendVoiceConfig sendet nur noch ttsEnabled/xttsVoice/whisperModel - toggleXTTSPanel als no-op Legacy-Stub (JS-Calls bleiben safe) Diagnostic Server (server.js): - handleSendVoiceConfig: nur noch ttsEnabled + xttsVoice + whisperModel - handleTestTTS: via xtts_request (nicht mehr Piper subprocess) - handleCheckTTS: via xtts_list_voices ueber RVS - handleGetVoiceConfig/Defaults bereinigt - Highlight-Trigger UI bleibt, wird aber von Bridge nicht mehr ausgewertet (dead-code im UI, spaeter ggf. fuer XTTS-Voice-Switch) README + issue.md aktualisiert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 22:24:42 +02:00
duffyduck	6ab6196739	feat: Streaming TTS — PCM-Stream statt WAV-Chunks (Weg A) Pipeline: XTTS-Server → xtts-bridge → aria-bridge → RVS → App AudioTrack XTTS-Bridge (Gaming-PC): - streamXTTSAsPCM(): liest /tts_to_audio/ Response inkrementell, parst WAV-Header (samplerate/channels), teilt PCM in 8KB-Chunks (~170ms bei 24kHz s16 mono) und sendet jeden als audio_pcm. - Finaler Chunk mit final=true nach letztem Text-Chunk aria-bridge: - audio_pcm Handler leitet payload 1:1 weiter, filled messageId aus requestId → messageId Map falls XTTS-Bridge messageId nicht hatte - Alter xtts_response Pfad bleibt als Legacy-Fallback (WAV) RVS: audio_pcm in ALLOWED_TYPES Android Native: - PcmStreamPlayerModule (Kotlin): AudioTrack MODE_STREAM mit Writer-Thread und BlockingQueue. start(rate, ch) / writeChunk(b64) / end() / stop() - 8x MinBufferSize grosszuegig dimensioniert, glatt auch bei Netz-Aussetzern - Registered im MainApplication via PcmStreamPlayerPackage App JS: - audioService.handlePcmChunk(): erkennt neue Session (messageId-Wechsel), started nativen Stream, cached PCM-Bytes pro Message. Bei final=true Stream sauber schliessen + _savePcmBufferAsWav → WAV-File im tts_cache/<messageId>.wav - _savePcmBufferAsWav: baut 44-byte WAV-Header (PCM s16le, korrekte samplerate/channels), haengt alle gesammelten base64-PCM-Chunks an - stopPlayback beendet auch aktiven PCM-Stream - ChatScreen routet type=audio_pcm an handlePcmChunk, bei final setzt audioPath in der Message Play-Button: falls messageId einen audioPath hat → WAV aus Cache (Sound-basiert), egal ob Original-TTS Piper oder XTTS war. Audio-Focus: - requestDuck() beim Stream-Start, release() bei Stream-Ende - Andere Apps (Spotify etc.) werden leiser waehrend ARIA spricht Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 22:01:27 +02:00
duffyduck	eb12281dfc	feat: TTS-Zeitbereiche + Diagnostic-Debug-Toggle + Play-Button respektiert Engine TTS-Cleanup erweitert: - Zeitbereiche: '8:00-9:00 Uhr' / '8-9 Uhr' → 'acht bis neun Uhr' - Uhrzeiten: '8:30 Uhr' → 'acht Uhr dreissig', '15 Uhr' → 'fuenfzehn Uhr' - Kleine Zahlen-Bereiche: '5-6' → 'fuenf bis sechs' (nur ≤24) - Zahlen 0-59 als deutsche Woerter (inkl. 'einundzwanzig', 'fuenfundvierzig') Diagnostic: TTS-Debug Einblenden - Checkbox 'TTS-Text einblenden' in der Chat-Test Kopfzeile - Unter ARIA-Nachrichten erscheint die aufbereitete Variante (blauer Border + Label 'TTS:') - Nur in Diagnostic, nicht in der App - LocalStorage persistiert den Toggle-Zustand - Minimaler JS-Port von clean_text_for_tts als Fallback Play-Button respektiert Engine: - Bridge: tts_request nutzt jetzt die aktive TTS-Engine (Piper/XTTS), Text wird durch clean_text_for_tts aufbereitet - messageId wird vom Play-Button mitgeschickt → Bridge verknuepft generiertes Audio mit der urspruenglichen Message - XTTS-Chunks: requestId → messageId Map (LRU 100 Eintraege), beim xtts_response wird die Basis-UUID extrahiert und die messageId dem audio-Frame angehaengt - App cached auch XTTS-Audio jetzt (letzter Satz pro Message — echte Chunk-Konkatenation bleibt TODO) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 21:48:32 +02:00
duffyduck	fc3bee6d05	feat: Runtime-Config via Diagnostic UI — kein .env-Sync mehr Framework fuer zentrale Runtime-Konfiguration: - /api/runtime-config (GET/POST) persistiert in /shared/config/runtime.json - Werte haben Vorrang ueber die ENV-Variablen aus aria.env - Feldliste: RVS_HOST/PORT/TLS/TOKEN, ARIA_AUTH_TOKEN, WHISPER_MODEL/LANGUAGE - Atomic write (tmp + rename) fuer Konsistenz Bridge: - load_config() liest nach aria.env noch runtime.json und ueberschreibt die Werte. Aenderungen werden beim Neustart der Bridge uebernommen. Diagnostic UI: - Neue Sektion "Runtime-Konfiguration" in Einstellungen - Formular fuer RVS-Credentials + Aria-Auth-Token - "Speichern" persistiert, triggert auch QR-Code-Regenerierung - Hinweis: Diagnostic-Container selbst bleibt auf ENV (erstmal) issue.md konsolidiert — 6 groessere Tasks dieser Session als erledigt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 16:18:37 +02:00
duffyduck	b203503fd8	feat: QR-Code Onboarding + TTS-Audio-Cache im Filesystem QR-Code Onboarding - Diagnostic: GET /api/onboarding gibt RVS-Credentials zurueck - Einstellungen-UI: neue Sektion mit QR-Code (qrcode-generator via CDN) - Format kompatibel mit bestehendem QRScanner.parseQRData (host/port/tls/token) - App-SettingsScreen hatte QR-Scanner bereits — funktioniert out of the box - Warnhinweis zu Token im Klartext TTS-Audio-Cache - Bridge: jede ARIA-Chat-Nachricht bekommt eine messageId (UUID) Audio-Payload wird mit messageId verknuepft (Piper-Pfade) - ChatScreen: messageId + audioPath in ChatMessage Interface - audioService.cacheAudio(): speichert Base64 in DocumentDirectory/tts_cache/<id>.wav - audioService.playFromPath(): spielt aus Cache ohne Regenerierung - Play-Button: wenn audioPath gesetzt → aus Cache, sonst tts_request - cleanupOldTTSCache(): alte unreferenzierte WAVs (>30 Tage) weg - Persistiert via AsyncStorage — ueberlebt App-Restart Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 16:16:25 +02:00
duffyduck	8b0a72dc9b	feat: NO_REPLY-Filter + Audio-Ducking + TTS-Cleanup 1) NO_REPLY Token wird in Bridge und Diagnostic erkannt und still verworfen. Toleranz fuer Variationen (Whitespace, Punkt, Quotes). Kein Chat-Eintrag, kein TTS. 2) AudioFocusModule (Kotlin) mit requestDuck / requestExclusive / release. AudioService ruft: - requestExclusive() bei Aufnahme-Start → andere Apps pausieren - requestDuck() bei TTS-Playback-Start → andere Apps leiser - release() bei Stop/Queue-Ende MainApplication registriert AudioFocusPackage. 3) clean_text_for_tts() in Bridge — zentrale Aufbereitung: - <voice>...</voice> Tag wird bevorzugt (falls ARIA es schreibt) - Code-Bloecke (``` und `) komplett raus - Markdown (Fett/Kursiv/Links/Headings/Listen) geschleift - Einheiten ausgeschrieben: 22GB → 22 Gigabyte, 85% → 85 Prozent - Abkuerzungen buchstabiert: CPU → C P U, API → A P I - URLs durch "ein Link" ersetzt Genutzt in VoiceEngine.synthesize und im XTTS-Request — Chat-Text an die App bleibt unveraendert (original Markdown), nur TTS kriegt die aufbereitete Version. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 16:10:54 +02:00
duffyduck	8c1014d281	fix: Thinking indicator respringt nach chat:final durch trailing events Nach chat:final kommen oft noch agent-Events rein (Core raeumt nach), die den Thinking-Indicator wieder anspringen liessen. - Diagnostic: 3s-Settled-Window nach chat:final, agent_activity-Broadcasts werden in dem Fenster unterdrueckt (idle kommt weiter durch). - Bridge: Gleiches Fenster in _emit_activity() — App bekommt keine trailing thinking/tool-Events mehr nach dem finalen Antwort. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-18 11:51:22 +02:00

1 2

94 Commits