ARIA-AGENT

Author	SHA1	Message	Date
duffyduck	570eb031e0	release: bump version to 0.1.8.6	2026-05-30 23:20:01 +02:00
duffyduck	e9615d987e	fix(audio): playbackFinished-Listener feuern erst wenn AudioTrack wirklich durch ist Race-Condition entdeckt im Log: nach jeder ARIA-Antwort lief endConversation 5s nach TTS-Start (= "letzter Chunk eingetroffen"), nicht wenn der AudioTrack-Hardware-Buffer wirklich am Ende war. ARIA sprach also noch hoerbar, waehrend OpenWakeWord schon re-armte. Folge: ARIAs eigene Stimme ging direkt nach AudioRecord.startRecording ins Mikro. Die OpenWakeWord-Sessions von AudioRecord und AudioTrack sind verschieden → AcousticEchoCanceler kann den Output nicht subtrahieren (kein gemeinsamer Reference-Stream). Threshold + Patience-State der Wake-Word-Inferenz wird durch ARIAs konstante Audio-Eingabe verwirrt, der naechste echte "Computer"-Trigger geht unter. Fix: Listener-Fire aus handlePcmChunk(isFinal=true) raus, dafuer in den schon existierenden PcmPlaybackFinished-Native-Event-Handler rein. Die Kotlin-Seite emittiert das Event aus dem Writer-Thread- finally-Block — also genau dann wenn AudioTrack alle Samples durchgeschrieben hat. Side-Effect: UI-Konsumenten von onPlaybackFinished sehen den "finished"-State jetzt 1-2s spaeter (= ehrlicher zur Realitaet, ist eigentlich eine UX-Verbesserung).	2026-05-30 23:18:53 +02:00
duffyduck	5e95eacd11	release: bump version to 0.1.8.5	2026-05-30 23:11:16 +02:00
duffyduck	ece08f0f2f	debug(wake): RVS-Log in endConversation — sichtbar machen ob re-arm greift Stefan beobachtet dass Wake-Word nach Conversation manchmal nicht re-armt. endConversation hatte bisher kein RVS-Logging — wir waren beim Diagnose blind. Loggt jetzt: - 'endConversation called but state=X → noop' (state-Mismatch) - 'endConversation called, calling OpenWakeWord.start()' (Eintritt) - 'OpenWakeWord.start() OK → state=armed' (Erfolg) - 'OpenWakeWord.start() FAIL: ... → state=off' (Native-Fehler) - 'fallback: nativeReady=false → state=off' (kein Native-Modul) Damit sehen wir im naechsten Test welcher Pfad gegriffen hat und ob das Native-Modul ueberhaupt aufgerufen wurde.	2026-05-30 23:09:11 +02:00
duffyduck	31fd0d7f7a	release: bump version to 0.1.8.4	2026-05-30 23:02:41 +02:00
duffyduck	263835ad74	fix(wake): Conversation-Window nur im Foreground, Background → direkt re-armen Symptom: Wake-Word laeuscht nach erfolgreicher Konversation im Hintergrund nicht wieder — erst beim App-Vorholen wird's wieder armed. Grund: nach TTS-Ende laeuft wakeWordService.resume() in einen setTimeout(800ms) der im Doze stark verzoegert wird. Der verspaetete Timer findet dann delay > 2800 und ruft endConversation (re-arm) — aber eben erst beim App-Resume. Fix: in onPlaybackFinished AppState pruefen: active → resume() wie bisher (Multi-Turn-Conversation-Window) background → endConversation() direkt — kein setTimeout, native OpenWakeWord.start() greift sofort. Begruendung fuer das Verhalten: - Foreground: User ist aktiv, Multi-Turn-Dialog ohne erneutes "Computer"-Sagen ist nuetzlich. - Background: User nutzt das Handy anderweitig, automatisches Mikro- Oeffnen ist nicht erwartet und droht durch Doze-Verzoegerung in ein Phantom-Trigger-Mismatch zu kippen. Direkt re-armen ist robust + erwartungskonform. Eng verwandt mit dem 0.1.7.0-Fix (kein setTimeout zwischen wake.detect und Callback) — selbes Doze-Throttling-Pattern, andere Stelle in der Pipeline.	2026-05-30 23:01:12 +02:00
duffyduck	ab7e9801ee	release: bump version to 0.1.8.3	2026-05-30 22:33:13 +02:00
duffyduck	3d001a1d03	feat(app): manueller Aufnahme-Knopf nutzt jetzt auch Streaming-STT VoiceButton rewrite — dB/VAD-Pfad endgueltig raus. Knopf ist jetzt nur noch UI-Trigger: - onTapStart (ChatScreen baut Bubble + startStreamingRecording) - onTapStop (ChatScreen ruft stopStreamingRecording) - audioService.onStateChange treibt die Animation (statt internem isRecording-Flag) - onSilenceDetected-Subscription weg ChatScreen: - handleVoiceRecording (Legacy) → handleVoiceButtonStart + handleVoiceButtonStop - Bubble wird beim Tap SOFORT gebaut (vorher: erst nach Stop), Text landet via audioRequestId-Match im chat-Handler-Update-Pfad - noSpeechTimeoutMs=0 (manueller Modus, User kontrolliert via Tap), hardCapMs=300_000 (5 Minuten Notbremse) - Wake-Word-conversing + manueller Stop = endConversation (User will nicht in Multi-Turn-Modus) - RecordingResult-Import entfaellt (nicht mehr genutzt) Damit ist die komplette App-seitige Aufnahme auf Streaming + ML- Endpointer. Der ganze dB/VAD-Apparat (vadEnabled, vadBaselineSamples, loadVadSilenceDbOverride, vadTimer, noSpeechTimer, etc.) ist jetzt nur noch Dead-Code — wird in einem Folge-Commit gemeinsam mit dem zugehoerigen Settings-Slider abgeraeumt.	2026-05-30 22:31:26 +02:00
duffyduck	91760dd2e1	release: bump version to 0.1.8.2	2026-05-30 22:24:28 +02:00
duffyduck	3c2e537420	fix(wake): kein Conversation-Window-Resume wenn JS-Thread verspaetet aufwacht Symptom: User sagt "Naechstes Lied bitte", ARIA spielt Track, Display geht aus, User holt 10s spaeter die App vor und sieht "Aufnahme laeuft" — als haette er Wake-Word gesagt. Klassisches Doze-Throttling: nach TTS-Ende schedulet resume() einen setTimeout(800ms) der den Conversation- Window-Callback feuert. Im Hintergrund parkt der JS-Thread, der Timer feuert erst beim App-Resume — gefuehlt ein Phantom-Trigger. Fix: scheduledAt-Timestamp messen, Delay nach dem setTimeout pruefen. Wenn der Timer >2.8s ueberfaellig ist (Schwelle = 800ms + 2000ms Toleranz), JS war im Background → endConversation statt Mikro-oeffnen. Wenn der User wirklich nachfragen will sagt er einfach nochmal "Computer".	2026-05-30 22:23:13 +02:00
duffyduck	97b6ea1b3e	release: bump version to 0.1.8.1	2026-05-30 22:14:36 +02:00
duffyduck	0bf6d49432	fix(app): UI-Fallback wenn Whisper-Bridge nicht antwortet streamEndpointFired-Latch + neue _fireEndpoint(ev)-Methode konsolidieren die drei Pfade die den Endpoint-Listener feuern (RVS-stt_endpoint, cancel, neuer Fallback). Listener feuert pro Session-Cycle maximal einmal. stopStreamingRecording bekommt einen 3-Sekunden-Watchdog: kommt in dem Fenster keine echte stt_endpoint-Antwort der Bridge, feuert der Listener mit text='' (reason=stop:...:no-response) damit ChatScreen die "wird verarbeitet"-Bubble unstickt + endConversation aufruft. Greift praktisch in zwei Faellen: - Whisper-Bridge laeuft alte/keine Streaming-Version (Stefan Gamebox- Restart vergessen) → wir bleiben sonst bis zur 60s-Hardcap haengen - User-initiated Stop + Whisper langsam/crashed	2026-05-30 22:09:02 +02:00
duffyduck	a68827fb38	fix(updater): parseInt(number) -> Number() — fileSize.size ist schon number	2026-05-30 21:45:17 +02:00
duffyduck	11ca316e4e	release: bump version to 0.1.8.0	2026-05-30 21:42:58 +02:00
duffyduck	be1d2e950a	feat(app): Streaming-STT-Pipeline — Phase 1+2 verdrahtet audio.ts: - neue Methoden startStreamingRecording / stopStreamingRecording / cancelStreamingRecording mit PcmStreamRecorder als AudioRecord-Source - permanenter RVS-Listener fuer stt_partial / stt_endpoint / stt_stream_done, Filterung ueber streamRequestId-Match - Callbacks onSttEndpoint(SttEndpointEvent) + onSttPartial(text) - No-Speech-Watchdog + App-seitiger Hard-Cap (+2s Toleranz gegen Bridge) - cancelStreamingRecording feuert onSttEndpoint mit text='' damit ChatScreen den No-Speech-Fall behandeln kann (wie frueher onSilenceDetected -> stopRecording() -> null) - Legacy startRecording / stopRecording / onSilenceDetected unangetastet -- VoiceButton (manuelle Aufnahme) nutzt das weiterhin ChatScreen.tsx: - Wake-Callback: startRecording -> startStreamingRecording - Bubble wird sofort gebaut, audioRequestId landet via stt_endpoint -> chat(sender=stt) im chat-Handler-Update-Pfad wie bisher - onSilenceDetected entfernt, ersetzt durch onSttEndpoint: text != '' -> log, aria-bridge triggert Brain selbst (Phase-2-Shortcut) text == '' -> endConversation (No-Speech-Fall) - Barge-In via Wake-Word: ebenfalls auf Streaming umgestellt - AppState-resume + toggleWakeWord-off pruefen jetzt isStreamingRecording() und nutzen passenden Cancel Damit: kein dB/VAD mehr im Hot-Path. Whisper hoert auf semantische Stille (kein neuer Text), Brain bekommt den Text direkt von aria-bridge, Audio-Roundtrip App->aria->whisper->aria->App entfaellt komplett.	2026-05-30 21:42:02 +02:00
duffyduck	199297a3a1	feat(android): natives PcmStreamRecorder-Modul — 16 kHz mono s16le → JS-Events Neues Native-Modul fuer die Streaming-STT-Pipeline: PcmStreamRecorder.start() — oeffnet AudioRecord 16 kHz mono PCM, VOICE_COMMUNICATION-Source mit AEC/NS, PARTIAL_WAKE_LOCK gegen Doze PcmStreamRecorder.stop() — sauber schliessen Event "PcmStreamChunk" — {pcm: base64-s16le, seq, ts} alle 200ms Event "PcmStreamError" — bei Capture-Crash 200ms-Chunks: gross genug fuer geringen RVS-Overhead, klein genug fuer granulares Endpointing in der Whisper-Bridge. Mic-Ownership: darf NICHT parallel zu OpenWakeWord laufen — beide wollen AudioRecord. Coordination liegt bei audio.ts (stop OWW vor start, start OWW nach stop), genau wie's bisher mit react-native- audio-recorder-player gemacht wurde.	2026-05-30 21:33:18 +02:00
duffyduck	095c1e2d70	release: bump version to 0.1.7.0	2026-05-30 21:02:59 +02:00
duffyduck	0145179aca	fix(wake): kein setTimeout zwischen wake.detect und Callback — JS-Timer im Doze unzuverlaessig Bridge-Log-Analyse zeigte: setTimeout(200ms) in onWakeDetected feuert im Hintergrund (Display aus) entweder gar nicht oder erst nach 8+ Sekunden, auch mit aktivem PARTIAL_WAKE_LOCK + Foreground-Service. Hermes parkt den JS-Thread sobald er idle ist und wartet auf Native-Wake-Events; die Bridge-Queue fuer Timer kommt erst dran wenn irgendein Native-Event (z.B. Audio-Sample) den Thread weckt. Drei Wake-Events live mitgelesen: - Vordergrund: Timer feuert +209ms (ok) - Hintergrund: Timer feuert +8061ms (wake-callback verspaetet) - Hintergrund: Timer feuert nie (>5 min, gong-Sound bleibt aus) OpenWakeWord.stop() ist davor awaited → Mikro ist garantiert frei. Der 200ms-Sicherheitsabstand war Belt-and-Suspenders, jetzt entbehrlich. Callback wird direkt synchron gefeuert.	2026-05-30 21:00:45 +02:00
duffyduck	c2475ffef6	release: bump version to 0.1.6.9	2026-05-30 20:46:55 +02:00
duffyduck	98982fea2f	feat(app): App-Logs live im Settings → Protokoll → Live Logs Tab anzeigen Stefan: "wir haben live log + events tab in protokoll einstellungen, da ist aber nie was drin". Bisher hoerten Live Logs / Events nur auf RVS-Messages type='log'/'event' von der Bridge — die Bridge schickt aktuell aber keine solchen Messages zurueck zur App. Plus: reportAppDebug/Error ging nur an die Bridge in /shared/logs/app.log, lokal in der App war nichts sichtbar. Loesung: lokaler DeviceEventEmitter-Bus. logger.ts: - APP_LOG_EVENT Konstante exportiert - reportAppError + reportAppDebug emittieren ZUSAETZLICH zum RVS-Send ein lokales DeviceEventEmitter-Event (errors immer, debug nur wenn Toggle AN) SettingsScreen.tsx: - DeviceEventEmitter.addListener auf APP_LOG_EVENT - Mappt Log-Entries 1:1 in den 'logs'-State (max 200) - Cleanup in useEffect-return Damit sieht Stefan beim Debuggen (Debug-Toggle AN, Live-Logs-Tab offen) live in der App was passiert — ohne curl gegen Bridge. APK neu bauen erforderlich. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:44:42 +02:00
duffyduck	356f8b3171	feat(app): Debug-Logs-an-Bridge Toggle (Settings → Protokoll, default aus) Stefan: "haben wir einen Menupunkt logging? sonst muellen wir uns dicht wenns funktioniert und wir das logging im moment nicht brauchen" Stimmt. reportAppDebug() schickt aktuell IMMER an Bridge, auch wenn gar nicht debuggt wird. Bei armed Wake-Word + Pipeline-Logs sind das schnell ein Dutzend Eintraege pro Wake-Trigger. Loesung: separater Settings-Toggle "Debug-Logs an Bridge" mit eigenem AsyncStorage-Key (aria_debug_logs_to_bridge), Default AUS. - logger.ts: _debugLogsToBridge flag + isDebugLogsToBridge() / setDebugLogsToBridge(). initLogger() laedt den Wert. reportAppDebug() prueft das Flag und schickt nur wenn AN. - SettingsScreen: neuer Toggle direkt unter Verbose-Logging, orange (#FF9500) damit er als "Power-User-Option" erkennbar ist, mit Erklaerungs-Hinweis dass nur Info-Logs gefiltert werden, Crash-Reports (Errors via reportAppError) gehen weiterhin IMMER. Workflow: - Default-User: Toggle aus, kein Traffic, kein Disk-Schreiben - Stefan beim Debuggen: Toggle an, testet die App, schaut Logs via curl /api/app-log?lines=N, schaltet wieder aus APK neu bauen erforderlich. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:41:40 +02:00
duffyduck	b4115bb345	debug(wake): mehr Log-Punkte zwischen onWakeDetected-Trigger und Callback-Feuern Stefan's Test zeigt: 'wake.detect keyword=computer state=armed' kommt im Background durch (WakeLock greift!), aber 'wake.cb callback fired' aus ChatScreen fehlt. Heisst: zwischen Detection und Callback-Feuern geht's irgendwo verloren. Mehr Logs: - nach OpenWakeWord.stop(): 'native stop ok' oder 'native stop FAIL msg' → klaert ob async stop() haengt - vor setTimeout: 'state→conversing, wakeCallbacks.length=N, scheduling' → klaert ob Liste leer ist (ChatScreen unmounted) und ob wir's schedulen - im setTimeout: 'timeout fired, state=X, cbs=N' → klaert ob der Timer in 200ms tatsaechlich feuert (Doze-Throttle?) - bei barge-path: 'barge path: cbs=N' Damit sehen wir genau wo's klemmt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:38:14 +02:00
duffyduck	02cac99ef9	release: bump version to 0.1.6.8	2026-05-30 20:29:41 +02:00
duffyduck	2940ce0075	release: bump version to 0.1.6.7	2026-05-30 20:28:38 +02:00
duffyduck	d78b668e31	feat(app): reportAppDebug — Live-Debug-Logs an Bridge ohne ADB Stefan-Anforderung: Background-Wake-Word-Pipeline klappt noch nicht, ADB nicht zur Hand → Debug via RVS-Log-Pipeline. Logger: - reportAppDebug(scope, message) analog zu reportAppError aber level=info, kein console.error, fuer Live-Diagnose Strategische Log-Punkte: - wakeword.ts: start() emits 'wake.start armed' - wakeword.ts: onWakeDetected emits 'wake.detect state=X' beim Native-Trigger-Empfang - ChatScreen.tsx wake-callback: 'wake.cb callback fired', 'wake.cb startRecording=X', 'wake.cb gong played' - backgroundAudio.ts: 'bg.start slot=X', 'bg.stop service stopped', 'bg.start.fail msg' wenn Service nicht hochkommt Abruf live via curl http://172.0.2.33:3001/api/app-log?lines=100 Damit kann Stefan nach APK-Build (mit allen Native-Fixes + Logger) im Background-Test exakt sehen wo es klemmt: - Kommt 'wake.detect' im Hintergrund an? (WakeLock-Frage) - Kommt 'wake.cb callback fired'? (JS-Bridge-Frage) - Geht 'bg.start slot=wake' durch? (Service-Start-Frage) APK neu bauen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:27:29 +02:00
duffyduck	a9115699db	release: bump version to 0.1.6.6	2026-05-30 20:21:29 +02:00
duffyduck	f2bfd4bbc6	feat(app): Background-GPS als opt-in Settings-Toggle Stefan-Anforderung: GPS soll auch im Hintergrund liefern (Auto-Szenarien, Handy-Tasche), aber NUR fuer Power-User die das bewusst aktivieren. Mama-Tauglichkeit bleibt erhalten — Default AUS, keine Surprise-Permission. Aenderungen: AndroidManifest: - ACCESS_BACKGROUND_LOCATION Permission - FOREGROUND_SERVICE_LOCATION Permission - AriaPlaybackService foregroundServiceType erweitert um \|location (vorher: mediaPlayback\|microphone) backgroundAudio.ts: - Neuer Slot 'location' zwischen 'wake' und 'background' in der Prioritaeten-Liste. Notification zeigt entsprechend. gpsTracking.ts: - isBackgroundGpsEnabled() / setBackgroundGpsEnabled() AsyncStorage-Helper - ensureBackgroundLocationPermission() pruefte ACCESS_BACKGROUND_LOCATION und oeffnet Android-Settings wenn fehlend (auf Android 10+ kann das NICHT ueber den normalen Permission-Dialog angefordert werden) - start(): wenn BG-GPS enabled, acquireBackgroundAudio('location') → Foreground-Service hochziehen mit type=location - stop(): releaseBackgroundAudio('location') SettingsScreen.tsx: - Neuer Toggle "GPS auch im Hintergrund" direkt unter dem GPS-Tracking-Toggle, rot (#FF3B30) statt orange weil's eine stark privacy-relevante Einstellung ist - Erklaerungs-Text zu Android-Settings + Akku-Verbrauch - Beim Aktivieren: Permission-Check, ggf. Android-Settings oeffnen - Wenn Tracking bereits laeuft: neustart damit location-Slot greift APK neu bauen erforderlich. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:19:16 +02:00
duffyduck	b182ef5ed5	release: bump version to 0.1.6.5	2026-05-30 20:12:39 +02:00
duffyduck	9818dc1867	fix(app): Spotify resumed wieder nach TTS — nudgeMediaResume mit TRANSIENT Stefan-Bug-Report: ARIA liest Nachricht vor, Spotify pausiert korrekt, ARIA spricht durch — aber Spotify spielt danach NICHT automatisch weiter. Sollte mit GAIN_TRANSIENT auto-resumen, tut es aber bei manchen Spotify-Versionen/Geraeten nicht zuverlaessig. Hintergrund: alte kickReleaseMedia() mit AUDIOFOCUS_GAIN (permanent) war zu aggressiv (Spotify interpretierte als "user stoppte" = Auto-Resume kaputt). Wurde entfernt. Jetzt ist das Pendel andersrum zu weit: ohne Nudge keine Resume. Sanfter Mittelweg: nudgeMediaResume() mit GAIN_TRANSIENT statt GAIN-permanent. 100ms hold, abandon. Spotify bekommt Focus-Wechsel- Hint ohne "user stopped"-Effekt. audio.ts: nach AudioFocus.release() 50ms warten, dann nudgeMediaResume. AudioFocusModule.kt: neue Methode + alte kickReleaseMedia bleibt mit ⚠️-Markierung fuer andere Use-Cases. APK neu bauen erforderlich. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:09:55 +02:00
duffyduck	543ad3c46d	fix(app): WakeLock auch im AriaPlaybackService — Pipeline-weiter Schutz Stefan-Ergaenzung: nach Wake-Word muss Aufnahme, Senden und ARIA- Antwort + TTS auch im Hintergrund klappen, und danach soll das ganze wieder von vorne als Konversations-Schleife laufen. Vorher hielt nur OpenWakeWordModule einen WakeLock (commit `408d20a`). Sobald Wake-Word erkannt wurde, ruft die JS-Seite OpenWakeWord.stop() fuer das Mic-Handover an audioService.startRecording() — und der WakeLock wurde released. Mid-Aufnahme konnte die CPU dann in Doze gehen, Audio-Chunks erreichten die JS-Bridge nicht zuverlaessig. Fix: AriaPlaybackService haelt selbst einen PARTIAL_WAKE_LOCK, solange der Foreground-Service aktiv ist. acquireBackgroundAudio() in der JS-Seite haelt den Service ueber alle Pipeline-Schritte (wake → rec → tts → wake) durchgehend — damit ist der WakeLock ueber die ganze Konversations-Schleife durchgehend aktiv. Doppelter Schutz (WakeLock auch im OpenWakeWordModule) bleibt drin als defense in depth — beide haben setReferenceCounted(false), also keine doppel-buchhaltung, einfach robuster gegen einzeln-failende acquires. APK neu bauen erforderlich (native Kotlin-Aenderung). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:04:55 +02:00
duffyduck	408d20a087	fix(app): PARTIAL_WAKE_LOCK fuer Wake-Word — JS-Bridge bleibt im Hintergrund aktiv Stefan-Bug-Report: Wake-Word wird im Hintergrund erkannt (Spotify pausiert sofort), aber der Gong + Aufnahme-Start kommen erst wenn die App in den Vordergrund geholt wird. Akku-Optimierung war bereits deaktiviert ("Hintergrund aktiv"). Ursache: Foreground-Service haelt den App-Prozess am Leben + erlaubt mic-Zugriff via foregroundServiceType=microphone. Aber: ohne expliziten WakeLock kann die CPU im Doze-Mode (Display aus / Telefon idle) die Auslieferung von DeviceEvents an die React-Native-JS-Bridge pausieren. Folge: Native erkennt Wake-Word, ruft emit("WakeWordDetected"), aber das Event queued sich nur — der JS-Listener (onWakeDetected → start- Recording + playWakeReadySound) feuert erst beim naechsten JS-Tick, und der kommt erst beim App-Resume. Fix: - AndroidManifest: WAKE_LOCK Permission hinzu (kein User-Prompt noetig, ist eine "normal" Permission). - OpenWakeWordModule.kt: PowerManager.PARTIAL_WAKE_LOCK in start() acquired (8h Cap als Sicherheit), in stop() + dispose() released. Lock-Tag "AriaCockpit:WakeWordRecord" damit der in adb shell dumpsys power sichtbar ist. Wirkung: solange Wake-Word "armed" ist, bleibt die CPU wach und die JS-Bridge verarbeitet die Detection-Events live — Gong, Mic-Start, ARIA-Antwort kommen ohne Foreground-Resume durch. APK muss neu gebaut werden (native Kotlin-Aenderung). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:03:08 +02:00
duffyduck	0756baa2a0	release: bump version to 0.1.6.4	2026-05-30 19:31:08 +02:00
duffyduck	70f4ff480e	fix(app): Mund-halten-Button stoppt ARIA jetzt sofort — AudioTrack flush vor stop Stefan-Bug-Report: wenn ich in der App auf den Mund-halten-Button klicke waehrend ARIA redet, stoppt sie nicht. Ursache: stopInternal() rief nur AudioTrack.stop() + release(). Das stoppt zwar den Track, aber der bereits in den Hardware-Buffer geschriebene PCM-Audio (200-500ms je nach Geraet) spielt noch hoerbar weiter. Fuer den User klang das so als wuerde der Button nichts tun. Fix in 2 Zeilen: AudioTrack.pause() + AudioTrack.flush() vor stop(). flush() verwirft den Hardware-Buffer-Inhalt, dadurch ist die Wiedergabe wirklich sofort still. pause() davor weil flush() laut Android-Docs nur in non-playing state safe ist. Native module ist kompiliert in app/build/tmp/kotlin-classes — APK muss neu gebaut werden damit der Fix greift. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 18:36:05 +02:00
duffyduck	5e1cb2d26a	release: bump version to 0.1.6.3	2026-05-28 23:58:26 +02:00
duffyduck	8359500476	feat(skills): P3 config_schema + P4 Versionierung mit Rollback P3 — Skill-Configuration - aria-brain/skills.py: SKILL_CONFIGS_FILE (/shared/config/skill_configs.json) als zentrale Werte-Persistenz. _normalize_config_schema validiert die Schema-Felder (name/type/label/secret/description/default), CFG_<UPPER_NAME> ENV beim run_skill. create_skill + update_skill akzeptieren config_schema. - agent.py: skill_set_config Brain-Tool fuer ARIA. skill_create/update um config_schema-Property erweitert. - main.py: GET/POST /skills/{name}/config — secret-Werte in Antwort gemaskt. P4 — Versionierung mit Rollback - aria-brain/skills.py: archive_current_version archiviert nach versions/v_<ts>/ (ohne venv/logs). update_skill ruft das automatisch auf bevor strukturelle Aenderungen passieren. list_skill_versions, rollback_skill (mit Safety-Snapshot + automatischem venv-Rebuild), delete_skill_version. - agent.py: skill_list_versions, skill_rollback Brain-Tools. - main.py: GET /skills/{name}/versions, POST /skills/{name}/rollback, DELETE /skills/{name}/versions/{version_id}. UI - diagnostic/index.html: Skill-Detail um Config-Form (typ-spezifisch, Secrets als password-Input mit *SET*-Hinweis) und Versions-Liste mit Rollback-/Delete-Button. - android SkillBrowser: SkillDetailModal laedt config_schema + versions on-mount. Config-Form (TextInput + Switch fuer boolean), Versionen mit Rollback-Confirm. brainApi um SkillConfigField/SkillVersion + getSkillConfig/setSkillConfig/listSkillVersions/rollbackSkill/ deleteSkillVersion erweitert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-28 23:52:46 +02:00
duffyduck	ad87c807de	fix(app): App-Reconnect nach Hintergrund — Sticky-Fallback, Zombie-WS, AppState-Hook Stefan musste seit der HTTPS-Umstellung nach jedem Hintergrund-Rueckkehr manuell auf "Verbinden" tippen, meist 3x bis es ging. Gleiche Bug-Klasse wie auf der Bridge davor (Sticky-Fallback), plus zwei App-spezifische Symptome. Drei Ursachen: 1. usingTLSFallback klebt: einmal nach onerror auf true gesetzt, blieb es bei allen folgenden Reconnects → App versuchte ws://...:443 gegen den TLS-only Caddy → HTTP 400 → endlos. Reset war NUR im manuellen connect(), nicht in onclose oder scheduleReconnect. Fix: in onclose `usingTLSFallback = false` damit der naechste Reconnect wieder primary (wss://) probiert. 2. Zombie-WebSocket: Android kann den TCP-Socket im Background still killen, der JS-State zeigt aber noch readyState === OPEN. Stefans manueller "Verbinden"-Klick rief connect() → "Bereits verbunden" No-Op statt sich neu aufzubauen. Fix: connect(force=true) optional, bestehendes WS-Objekt wird hart geschlossen (mit onclose=null gegen Doppel-Reconnect) bevor neuer Aufbau startet. 3. Keine aktive Reconnect-Sequence bei Foreground-Resume: App war abhaengig von onclose-Events die bei Zombie-WS nicht zwingend feuern. Fix: AppState-Listener in App.tsx, bei background → active automatischer rvs.connect(true). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-25 10:09:30 +02:00
duffyduck	72277098af	release: bump version to 0.1.6.2	2026-05-25 10:00:47 +02:00
duffyduck	13e87fb083	feat(oauth): ARIA kann Provider selbst registrieren + Custom-Provider in Diagnostic & App ARIA hat jetzt das META-Tool oauth_register_provider. Wenn Stefan einen Service nutzen will, der nicht in den (auf Spotify reduzierten) Defaults ist, kann sie auth_url/token_url/scopes/client_auth selbst eintragen — ARIA kennt typische OAuth-Endpunkte (Dropbox, Discord, Notion, Slack, Zoom, Trello, LinkedIn, Reddit, Twitch) aus ihrem Training. Sie traegt NUR die URLs ein, client_id/secret bleiben Stefans Job (Diagnostic / App-UI) — bewusste Trennung damit Credentials nicht im Chat-Verlauf landen. DEFAULT_PROVIDERS auf Spotify reduziert — Rest war aktuell ungenutzt und macht den Code unnoetig "groß". ARIA registriert on-demand. Diagnostic-UI: - Custom-Provider zeigen auth_url/token_url/scopes als sichtbare Felder - Defaults verstecken die Felder hinter "Default-URLs ueberschreiben (advanced)" damit man die Spotify-URLs nicht versehentlich loescht - "+ Custom OAuth-Provider hinzufuegen" Button mit Prompts fuer Name/URLs/Scopes - 🗑-Icon bei Custom-Services (Service komplett entfernen) App-UI (neu fuer unterwegs): - Settings → Sektion 🔑 "OAuth-Apps" zwischen Skills und Protokoll - OAuthBrowser-Komponente analog zu Trigger/Skill-Browser: Liste mit Status, Tap → Edit-Modal mit client_id/secret + Advanced-Toggle fuer URLs. "Autorisieren ↗" oeffnet System-Browser via Linking.openURL, redirected zur RVS-Callback-Page, Status-Refresh nach 8s. - "+ Custom"-Button → Full-Screen-Modal fuer Service-Anlage. - brainApi um listOAuthServices/getOAuthApps/saveOAuthApp/ deleteOAuthApp/authorizeOAuth/revokeOAuth erweitert. Workflow ist jetzt: "verbinde mich mit Dropbox" → ARIA registriert Provider → "trag client_id/secret in Settings ein" → Stefan macht das in App oder Diagnostic → "Autorisieren ↗" → fertig. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-24 20:16:31 +02:00
duffyduck	30c1dd7473	feat(app+brain): App-Bugfixes + Skill-Mgmt-Tools + Voice-Speed persistent + Skill-Browser App-Bugs: - Trigger-Liste war leer: brainApi.listTriggers() cast'te {triggers: [...]} direkt als Array, t.sort() warf — TriggerBrowser blieb leer. Fix: unwrap. - GPS-Tracking startete erst bei SettingsScreen-Mount, nicht beim App-Boot. Wenn Stefan direkt in den Chat ging, blieb GPS aus. Fix: restoreFromStorage() in App.tsx useEffect. - Text in Chat-Bubbles nicht markierbar / kein Copy-Mechanismus: Bubble jetzt Pressable mit onLongPress + neues ⎘-Icon in Status-Row → openBubbleActions(). Alert-Menu mit "Ganzen Text teilen" + pro extrahierte URL/Mail/Tel eine eigene Option. Share.share() — keine neuen Native-Deps noetig. Brain — Skill-Mgmt: - ARIA legte beim Skill-Umbau neue Versionen mit Suffix an (Skill-Friedhof), weil sie kein Update/Delete-Tool kannte. Zwei neue META_TOOLS in agent.py: skill_update (kann entry_code, readme, pip_packages, args, description, active patchen — venv wird bei pip_packages-Aenderung rebuilt) + skill_delete. - skills.py update_skill um entry_code/readme/pip_packages erweitert, venv-Rebuild bei pip-Aenderung. Bridge — Voice-Speed persistent: - _next_speed_override war pro-Request-Override ohne Persistenz. Bei Diagnostic-Chats / Trigger-Replies ohne vorherigen App-Chat fiel der Speed auf 1.0 zurueck, ebenso nach Bridge-Restart. Jetzt: _persistent_xtts_speed aus voice_config.json (xttsSpeed), wird nach jedem App-chat mit speed autopersistiert. TTS-Generation faellt zurueck: per-Request > persistent > 1.0. App — Feature 6: - SkillBrowser.tsx: Liste aller Skills, Toggle aktiv/inaktiv, Detail-Modal mit Args-Inputs, Ausfuehren mit Live-stdout/stderr, Logs der letzten 20 Runs, Loeschen. Settings-Sektion "Skills" (🛠️) zwischen Trigger und Protokoll. brainApi.listSkills/getSkill/runSkill/updateSkill/deleteSkill/ getSkillLogs ergaenzt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-24 17:24:03 +02:00
duffyduck	8ad3e39453	release: bump version to 0.1.6.1	2026-05-16 23:29:54 +02:00
duffyduck	2d348aeec7	feat(flux): Modell-Wahl per Diagnostic + raw/switch-Keywords + Download-Hinweis Diagnostic-Einstellungen fuer FLUX: - Default-Modell (dev \| schnell) — wird via RVS gepusht, flux-bridge hot-swappt die Pipeline aus dem HF-Cache (~15-30s) - Raw-Keyword (Default 'flux') — Pipe-Modus, Brain leitet Stefans Text 1:1 als prompt durch, kein Rewriting/Beautify - Switch-Keyword (Default 'fix') — zwingt das ANDERE Modell als Default Brain-Tool flux_generate um model + raw erweitert, System-Prompt-Block mit den aktuellen Diagnostic-Settings + Whisper-Toleranz-Hinweis. Kein eager Bootstrap-Load: flux-bridge wartet auf config oder ersten Request. Bei erstem HF-Download zeigt Banner "laedt erstmalig runter" mit Pfeil-Icon, Toast in der App wenn fertig. FLUX_MODEL aus der .env entfernt (Steuerung jetzt komplett ueber Diagnostic). HF_TOKEN-Kommentar erklaert warum trotz lokaler Inference noetig (HF Gate-Mechanismus fuer FLUX.1-dev). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-16 23:11:22 +02:00
duffyduck	33d5be781f	release: bump version to 0.1.6.0	2026-05-16 19:21:04 +02:00
duffyduck	785f5d0805	fix(bridge): grosse File-Re-Downloads zerreissen nicht mehr die WS Symptom (aus Bridge-Log): bei chat_history_request triggert die App file_request fuer alle fehlenden Anhaenge. Bei einem 40 MB MP4 wird das base64-encoded ~53 MB, ueberschreitet das RVS-maxPayload (50 MB). Server droppt mit Code 1009 'message too big', Bridge crasht im cleanup mit AttributeError 'NoneType has no call_soon' (websockets-Lib-Bug bei nested context-manager-cleanup nach abgerissener Verbindung). Drei Layer: (1) RVS-Server: maxPayload 50 → 100 MB — deckt ~70 MB binaer ab nach base64-inflate. Comment im server.js erklaert den Hintergrund. (2) Bridge: max_size 50 → 100 MB synchron zum Server. PLUS pre-check im file_request-Handler — Dateien > 70 MB werden mit Fehler-Response abgewiesen statt blind base64-zu-encoden und die WS zu killen. Limit knapp unter Server-Limit damit Bridge proaktiv blockiert. (3) App: file_response-Handler liest 'error'-Feld aus dem Payload und zeigt nen Toast 'Datei X: Datei zu gross fuer Transfer (40 MB, Limit 70 MB)'. Statt einfach zu schweigen oder endlos zu retryen. Crash bei websockets-cleanup ist ein Lib-Bug (NoneType.call_soon) — nicht direkt fixbar, aber tritt jetzt nicht mehr auf weil Bridge proaktiv die zu grossen Files ablehnt und die WS nicht mehr abreisst. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-16 19:18:52 +02:00
duffyduck	fac87474ec	release: bump version to 0.1.5.9	2026-05-16 18:41:10 +02:00
duffyduck	8227266aea	release: bump version to 0.1.5.8	2026-05-16 18:06:37 +02:00
duffyduck	5d24e01d4b	release: bump version to 0.1.5.7	2026-05-16 16:39:35 +02:00
duffyduck	4fe72cc4a8	feat(chat): System-Hints in Bubbles ausblenden (Toggle in Settings) Bridge fuegt User-Texten Praefixe in eckigen Klammern hinzu damit Brain Kontext hat — z.B. '[Stefans aktuelle GPS-Position: 53.0, 8.5. Nutze die nur wenn ...]' oder '[Hinweis: Stefan hat dich gerade unterbrochen...]'. Die landeten via chat_backup auch in der App-Bubble — Stefan sieht jeden Hint mit, hat nichts in der UI verloren. Fix: App-side stripSystemHints() filtert aufeinanderfolgende `[...]`- Bloecke am Textanfang inkl. Trennleerzeichen. Wird in renderMessage angewendet, default an (Hints versteckt). Toggle in Settings → Allgemein → 'Chat-Bubbles' kehrt's um falls Debug gewuenscht. Brain bekommt weiterhin den vollen Text — Bridge-Side unveraendert. Live-Toggle: Settings setzt aria_show_hints in AsyncStorage, ChatScreen re-liest alle 2s (gleicher Mechanismus wie tts_enabled etc.). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-16 16:21:12 +02:00
duffyduck	0044e222db	fix(phone): Anruf-Erkennung im Hintergrund + bei gesperrtem Display Symptom: App bekommt im minimierten oder display-gesperrten Zustand nicht mit ob ein Anruf angefangen oder beendet wurde — TTS spricht weiter waehrend Telefon klingelt, oder bleibt stumm nach Auflegen. Zwei Ursachen: 1) Kotlin: TelephonyCallback war auf reactApplicationContext.mainExecutor registriert. Wenn die Activity pausiert ist (display aus, App im Hintergrund), wird der mainExecutor verzoegert oder gar nicht abgearbeitet — Call-State-Events kommen nicht durch. Fix: eigener Executors.newSingleThreadExecutor() — laeuft unabhaengig vom UI-Thread solange der App-Prozess lebt (Foreground-Service garantiert das). 2) TS: TelephonyManager-Listener kann nach laengerer Hintergrund-Zeit verloren gehen (React-Bridge-Context recreated nach Resume). Fix: neue refresh()-Methode in phoneCallService, AppState-Resume ruft sie auf — wenn telephonyAttached=false ist, wird der Native- Listener neu attached. Plus: Status-Property telephonyAttached macht in Logs sichtbar ob Pfad 1 (TelephonyManager) wirklich greift. Pfad 2 (AudioFocus fuer VoIP) war nie betroffen, der laeuft komplett im Native-Code. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-16 15:59:55 +02:00
duffyduck	048d231b60	fix(wake): false-positive nach langer Hintergrund-Pause verwerfen Symptom: Ohr aktiv, App im Hintergrund (jetzt mit Foreground-Service permanent lebendig), nach laengerer Zeit oeffnet Stefan die App und sie nimmt schon auf — angeblich Wake-Word getriggert. War aber TV/Husten/ sonstige Hintergrund-Geraeusche waehrend Stefan nicht da war. Mit dem neuen Hintergrund-Modus laeuft openWakeWord jetzt permanent und faengt jedes False-Positive im Hintergrund auf. Ohne dieser Fall war das nicht moeglich weil die JS-Engine pausiert war. Fix: Heuristik beim AppState-Resume in ChatScreen.tsx - backgroundDauer wird gemerkt (lastBackgroundAt vs Resume-Zeit) - Wenn >30s im Hintergrund UND state='conversing' UND letzter Wake- Trigger juenger als 15s: false-positive — Aufnahme abbrechen + zurueck zu armed - Resume-Cooldown 1500 → 3000 ms (Audio-Spikes beim AppState-Switch haben gelegentlich nach 1.5s noch nicht verklungen) Neue Methoden: - wakeword.ts: lastTriggerAt-Tracking + discardIfFreshlyTriggered(maxAge) - audio.ts: cancelRecording() — bricht recorder ab ohne Result zu emittieren, loescht die Audio-Datei Setzt voraus dass Stefan nicht laenger als 30s im Hintergrund mit ARIA spricht ueber Wake-Word. Falls doch: bei Resume waere die Aufnahme weg und er muesste nochmal triggern. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-16 15:54:07 +02:00
duffyduck	2bac9c26ca	release: bump version to 0.1.5.6	2026-05-16 14:32:34 +02:00

1 2 3 4 5 ...

379 Commits