ARIA-AGENT

Author	SHA1	Message	Date
duffyduck	ba26fa5880	feat(voice): ARIA produziert TTS-sprechbare Variante via <voice>-Tag Stefan-Beobachtung: Wetterbericht klang scheisse, weil 'kt'/'°C'/Komma- Zahlen literal vorgelesen wurden. Der clean_text_for_tts-Regex kennt nur Markdown + ein paar Uhrzeit-Patterns — Einheiten ausschreiben war never on the table mit Regex (waechst sonst zur Mammut-Tabelle). Loesung: hybrid. ARIA selbst macht die semantisch korrekte TTS-Variante, Regex bleibt als Safety-Net. bridge/aria_bridge.py: - neue Helper strip_voice_tag_for_display(text) - chat-broadcast (1188) und chat_backup-Persist (1157) strippen den Tag BEVOR Output. ARIA's `<voice>...</voice>` lebt nur transient in `text` bis clean_text_for_tts ihn fuer TTS extrahiert. - clean_text_for_tts unveraendert (kennt den Tag schon seit Phase 1). aria-brain/seed_rules.py: - neue seed-rule voice/tts-voice-tag mit klarer Trigger-Liste (Einheiten, Komma-Zahlen, Uhrzeiten, Statusberichte, lange IDs/Codes) - klare Anti-Trigger (kurze 'OK'/'mache ich'-Antworten — kein doppelter Text fuer Trivia) - drei konkrete Beispiele (Wetter, Uhrzeit, Server-Status, Music-Now-Playing) Output-Format: ARIA schreibt erst Chat-Display-Variante (mit Markdown OK), haengt dann an EINER neuen Zeile den <voice>-Block an. Tag wird automatisch gestrippt fuer App-Anzeige + Chat-Backup. f5tts kriegt nur den voice-Inhalt. Beide Welten happy: Stefan sieht hervorgehobenes Markdown in der Bubble, hoert sprechbar formulierten Text aus dem Lautsprecher. Keine wachsende Regex-Tabelle mehr. Deploy: brain rebuild + restart, bridge restart.	2026-05-31 01:20:17 +02:00
duffyduck	027ba2896d	fix(brain): dritter Tool-Result-Truncation-Punkt — agent.py:947 von 8KB auf 50KB Im Stefan-Test (31.05.2026) hat ARIA das spotify-Skill korrekt mit _all=true aufgerufen, der Skill paginierte sauber alle 90 Playlists in 34 KB compact JSON. Aber: ARIA's Thinking sagte 'tool result was cut off'. Disk-Log + Skill-Return waren beide OK. agent.py:1160 cap ist 50 KB (passt). Aber: agent.py:947 cap'd tool_result[:8000] beim Append in die Proxy- Conversation. DRITTER Truncation-Punkt fuer denselben Output, fuer Claude effectiv abgeschnitten — Skill liefert 34 KB, ARIA sieht 8 KB. Auf 50 KB hochgesetzt (konsistent mit dem anderen Cap in derselben Datei). Tests + nochmal restart noetig. Lerneffekt: bei Stdout-Caps suche IMMER alle Truncation-Punkte. War jetzt der dritte den ich heute gefunden hab. ;-)	2026-05-31 01:03:20 +02:00
duffyduck	86f20d3b64	clude config	2026-05-31 00:19:54 +02:00
duffyduck	78211f09ce	feat(brain): Listen-API-Pagination strukturell loesen + seed-rule Stefan-Reproduktion vom 31.05.2026: bei 'Such Playlist Prodigy raus' hat ARIA die Spotify-Pagination drei Mal hintereinander laufen lassen, jedes Mal eine andere Playlist-ID gefunden, am Ende falsche abgespielt. Spotify sortiert /v1/me/playlists nach recently-played — die Reihen- folge aendert sich zwischen Calls wenn parallel was laeuft, also liefern aufeinanderfolgende paginierte Runs inkonsistente Snapshots. Loesungen: 1. spotify-Skill _all=true (via skill_update angewendet, lebt nur in /data/skills/spotify/ im Container, nicht in git): Skill prueft _all=true im URL-Query, paginiert dann intern ueber Spotifys next-Field bis MAX_PAGES (20) oder fertig. Liefert konsolidiertes JSON {items, total, fetched_count, fetched_pages}. EIN Tool-Call, konsistenter Snapshot. 2. skills.py: Stdout-Truncation entkoppeln. Vorher: 8000-char-Cap sowohl fuer Disk-Log als auch fuer Return-Value an Agent. Konsequenz: _all=true Output (50 KB JSON) wurde fuer ARIA auf 8 KB gekuerzt, sie sah nur die ersten ~20 Playlists. Jetzt: - Disk-Log: weiterhin 8 KB pro stdout (Disk-Schoner) - Return-Value: ungekuerzt, agent.py macht 50 KB downstream-Cap Skills.py:687 — record-Dict aufgesplittet in log_record + record. 3. seed_rule list-api-pagination-snapshot: dokumentiert das Pattern fuer ARIA — bei Pagination-Resultaten IMMER vollstaendig laden bevor Entscheidung; _all=true bevorzugen wo verfuegbar; bei inkonsistenten Match-Resultaten ehrlich nachfragen statt raten. Mit konkreter Antipattern-Sammlung aus Stefans Test. Deployment: brain restart noetig damit (2) und (3) greifen. Skill- Code (1) ist schon via PATCH /skills/spotify aktiv.	2026-05-31 00:14:06 +02:00
duffyduck	b2edee9adb	release: bump version to 0.1.8.8 v0.1.8.8	2026-05-30 23:32:27 +02:00
duffyduck	bb13477ef9	fix(wake): Race zwischen endConversation und stopBargeListening killt Wake-Word-Listener nach jeder Konversation Aus dem Log diagnostiziert: zwei onPlaybackFinished-Listener feuern direkt hintereinander wenn TTS endet: 1. mein neuer Listener (Background): endConversation() → state=armed, OpenWakeWord.start() (idempotent) 2. existierender Listener: stopBargeListening() → bargeListening=true → OpenWakeWord.stop() ← killt re-armed Listener State zeigte 'armed' (UI: Ohr-Icon ausgefuellt, sieht aktiv aus), aber das Native-Modul war gestoppt → Stefan's "Computer" verpufft. Fix: endConversation setzt bargeListening=false BEVOR Native gerufen wird. stopBargeListening checkt das Flag oben: async stopBargeListening() { if (!this.bargeListening) return; ... } → wird zum No-Op wenn endConversation schon gelaufen ist. Bonus: OpenWakeWord.start() darf jetzt auch gerufen werden wenn der Listener via barge-listening schon lief — Kotlin checkt running.get() und resolved idempotent. Sicherer als state-vorher-Check.	2026-05-30 23:31:25 +02:00
duffyduck	710e7c88d8	release: bump version to 0.1.8.7 v0.1.8.7	2026-05-30 23:23:52 +02:00
duffyduck	b6ee5552f0	fix(app): Dateimanager Einzel-Download landet jetzt im Downloads-Ordner Bug: '⬇ Download' im Dateimanager schickte file_request raus, aber kein SettingsScreen-Handler nahm das file_response auf. ChatScreen fing es zwar global ab, versuchte aber nur Chat-Bubble-Attachments zu patchen — kein Match, also passierte sichtbar nichts. Fix: Handler in SettingsScreen fuer file_response mit requestId-Praefix 'single-' (aus bulkDownload-1-Datei-Pfad). Schreibt nach RNFS.DownloadDirectoryPath, mit Suffix-Inkrement bei Namens-Konflikt damit nichts ueberschrieben wird. Multi-Datei-Download (ZIP) lief schon ueber file_zip_response, unangetastet.	2026-05-30 23:22:44 +02:00
duffyduck	570eb031e0	release: bump version to 0.1.8.6 v0.1.8.6	2026-05-30 23:20:01 +02:00
duffyduck	e9615d987e	fix(audio): playbackFinished-Listener feuern erst wenn AudioTrack wirklich durch ist Race-Condition entdeckt im Log: nach jeder ARIA-Antwort lief endConversation 5s nach TTS-Start (= "letzter Chunk eingetroffen"), nicht wenn der AudioTrack-Hardware-Buffer wirklich am Ende war. ARIA sprach also noch hoerbar, waehrend OpenWakeWord schon re-armte. Folge: ARIAs eigene Stimme ging direkt nach AudioRecord.startRecording ins Mikro. Die OpenWakeWord-Sessions von AudioRecord und AudioTrack sind verschieden → AcousticEchoCanceler kann den Output nicht subtrahieren (kein gemeinsamer Reference-Stream). Threshold + Patience-State der Wake-Word-Inferenz wird durch ARIAs konstante Audio-Eingabe verwirrt, der naechste echte "Computer"-Trigger geht unter. Fix: Listener-Fire aus handlePcmChunk(isFinal=true) raus, dafuer in den schon existierenden PcmPlaybackFinished-Native-Event-Handler rein. Die Kotlin-Seite emittiert das Event aus dem Writer-Thread- finally-Block — also genau dann wenn AudioTrack alle Samples durchgeschrieben hat. Side-Effect: UI-Konsumenten von onPlaybackFinished sehen den "finished"-State jetzt 1-2s spaeter (= ehrlicher zur Realitaet, ist eigentlich eine UX-Verbesserung).	2026-05-30 23:18:53 +02:00
duffyduck	5e95eacd11	release: bump version to 0.1.8.5 v0.1.8.5	2026-05-30 23:11:16 +02:00
duffyduck	ece08f0f2f	debug(wake): RVS-Log in endConversation — sichtbar machen ob re-arm greift Stefan beobachtet dass Wake-Word nach Conversation manchmal nicht re-armt. endConversation hatte bisher kein RVS-Logging — wir waren beim Diagnose blind. Loggt jetzt: - 'endConversation called but state=X → noop' (state-Mismatch) - 'endConversation called, calling OpenWakeWord.start()' (Eintritt) - 'OpenWakeWord.start() OK → state=armed' (Erfolg) - 'OpenWakeWord.start() FAIL: ... → state=off' (Native-Fehler) - 'fallback: nativeReady=false → state=off' (kein Native-Modul) Damit sehen wir im naechsten Test welcher Pfad gegriffen hat und ob das Native-Modul ueberhaupt aufgerufen wurde.	2026-05-30 23:09:11 +02:00
duffyduck	31fd0d7f7a	release: bump version to 0.1.8.4 v0.1.8.4	2026-05-30 23:02:41 +02:00
duffyduck	263835ad74	fix(wake): Conversation-Window nur im Foreground, Background → direkt re-armen Symptom: Wake-Word laeuscht nach erfolgreicher Konversation im Hintergrund nicht wieder — erst beim App-Vorholen wird's wieder armed. Grund: nach TTS-Ende laeuft wakeWordService.resume() in einen setTimeout(800ms) der im Doze stark verzoegert wird. Der verspaetete Timer findet dann delay > 2800 und ruft endConversation (re-arm) — aber eben erst beim App-Resume. Fix: in onPlaybackFinished AppState pruefen: active → resume() wie bisher (Multi-Turn-Conversation-Window) background → endConversation() direkt — kein setTimeout, native OpenWakeWord.start() greift sofort. Begruendung fuer das Verhalten: - Foreground: User ist aktiv, Multi-Turn-Dialog ohne erneutes "Computer"-Sagen ist nuetzlich. - Background: User nutzt das Handy anderweitig, automatisches Mikro- Oeffnen ist nicht erwartet und droht durch Doze-Verzoegerung in ein Phantom-Trigger-Mismatch zu kippen. Direkt re-armen ist robust + erwartungskonform. Eng verwandt mit dem 0.1.7.0-Fix (kein setTimeout zwischen wake.detect und Callback) — selbes Doze-Throttling-Pattern, andere Stelle in der Pipeline.	2026-05-30 23:01:12 +02:00
duffyduck	ab7e9801ee	release: bump version to 0.1.8.3 v0.1.8.3	2026-05-30 22:33:13 +02:00
duffyduck	3d001a1d03	feat(app): manueller Aufnahme-Knopf nutzt jetzt auch Streaming-STT VoiceButton rewrite — dB/VAD-Pfad endgueltig raus. Knopf ist jetzt nur noch UI-Trigger: - onTapStart (ChatScreen baut Bubble + startStreamingRecording) - onTapStop (ChatScreen ruft stopStreamingRecording) - audioService.onStateChange treibt die Animation (statt internem isRecording-Flag) - onSilenceDetected-Subscription weg ChatScreen: - handleVoiceRecording (Legacy) → handleVoiceButtonStart + handleVoiceButtonStop - Bubble wird beim Tap SOFORT gebaut (vorher: erst nach Stop), Text landet via audioRequestId-Match im chat-Handler-Update-Pfad - noSpeechTimeoutMs=0 (manueller Modus, User kontrolliert via Tap), hardCapMs=300_000 (5 Minuten Notbremse) - Wake-Word-conversing + manueller Stop = endConversation (User will nicht in Multi-Turn-Modus) - RecordingResult-Import entfaellt (nicht mehr genutzt) Damit ist die komplette App-seitige Aufnahme auf Streaming + ML- Endpointer. Der ganze dB/VAD-Apparat (vadEnabled, vadBaselineSamples, loadVadSilenceDbOverride, vadTimer, noSpeechTimer, etc.) ist jetzt nur noch Dead-Code — wird in einem Folge-Commit gemeinsam mit dem zugehoerigen Settings-Slider abgeraeumt.	2026-05-30 22:31:26 +02:00
duffyduck	91760dd2e1	release: bump version to 0.1.8.2 v0.1.8.2	2026-05-30 22:24:28 +02:00
duffyduck	3c2e537420	fix(wake): kein Conversation-Window-Resume wenn JS-Thread verspaetet aufwacht Symptom: User sagt "Naechstes Lied bitte", ARIA spielt Track, Display geht aus, User holt 10s spaeter die App vor und sieht "Aufnahme laeuft" — als haette er Wake-Word gesagt. Klassisches Doze-Throttling: nach TTS-Ende schedulet resume() einen setTimeout(800ms) der den Conversation- Window-Callback feuert. Im Hintergrund parkt der JS-Thread, der Timer feuert erst beim App-Resume — gefuehlt ein Phantom-Trigger. Fix: scheduledAt-Timestamp messen, Delay nach dem setTimeout pruefen. Wenn der Timer >2.8s ueberfaellig ist (Schwelle = 800ms + 2000ms Toleranz), JS war im Background → endConversation statt Mikro-oeffnen. Wenn der User wirklich nachfragen will sagt er einfach nochmal "Computer".	2026-05-30 22:23:13 +02:00
duffyduck	97b6ea1b3e	release: bump version to 0.1.8.1 v0.1.8.1	2026-05-30 22:14:36 +02:00
duffyduck	94ee0455a2	fix(rvs): Streaming-STT-Message-Types whitelisten Die ALLOWED_TYPES-Whitelist im RVS-Hub droppte stt_stream_start / stt_audio_chunk / stt_stream_end / stt_partial / stt_endpoint / stt_stream_done silent — App schickt, niemand kriegt. Das hat Phase 1+2 komplett tot gemacht obwohl App + Whisper-Bridge korrekt deployed waren. Sechs neue Types eingetragen, dann fluppt's.	2026-05-30 22:13:31 +02:00
duffyduck	0bf6d49432	fix(app): UI-Fallback wenn Whisper-Bridge nicht antwortet streamEndpointFired-Latch + neue _fireEndpoint(ev)-Methode konsolidieren die drei Pfade die den Endpoint-Listener feuern (RVS-stt_endpoint, cancel, neuer Fallback). Listener feuert pro Session-Cycle maximal einmal. stopStreamingRecording bekommt einen 3-Sekunden-Watchdog: kommt in dem Fenster keine echte stt_endpoint-Antwort der Bridge, feuert der Listener mit text='' (reason=stop:...:no-response) damit ChatScreen die "wird verarbeitet"-Bubble unstickt + endConversation aufruft. Greift praktisch in zwei Faellen: - Whisper-Bridge laeuft alte/keine Streaming-Version (Stefan Gamebox- Restart vergessen) → wir bleiben sonst bis zur 60s-Hardcap haengen - User-initiated Stop + Whisper langsam/crashed	2026-05-30 22:09:02 +02:00
duffyduck	493cba36a2	feat(diagnostic): RVS-Debug-Logs fuer Whisper- und F5TTS-Bridge Stefan's Gamebox ist Windows (kein SSH-Zugriff), und in Zukunft koennten whisper/f5tts auf separaten Hosts laufen. Wir brauchen deshalb einen Logging-Pfad ueber RVS — gleicher Mechanismus wie fuer die App (reportAppDebug). Beide Bridges senden jetzt app_log-Messages mit platform="whisper" bzw. "f5tts". aria-bridge schreibt sie in /shared/logs/app.log (unverändert), Live-Logs-Tab + Diagnostic /api/app-log lesen mit. Toggle via aria-bridge config: whisperDebugLog: bool — default OFF (aktuell aber ON in whisper-bridge weil wir Phase-1/2- Pipeline einfahren) f5ttsDebugLog: bool — default OFF Beide werden in voice_config.json persistiert + nach RVS-Connect rebroadcastet, damit Toggle Container-Restart ueberlebt. Whisper-Bridge logt aktuell: boot → Streaming-Mode-Marker (sehen wir damit ob neue Version aktiv ist) stream.start → stt_stream_start angekommen stream.chunk → alle 25 Chunks (=5s Audio) einer stream.chunk.reject → Chunk fuer unbekannte Session stream.partial → Whisper hat neuen Text erkannt stream.final → Endpoint detected, finaler Text raus stream.end → stt_stream_end angekommen config → Toggle umgeschaltet F5TTS-Helper ist da (gleicher Pattern), Logging-Punkte kommen spaeter wenn wir ein konkretes TTS-Problem zu debuggen haben.	2026-05-30 22:00:55 +02:00
duffyduck	a68827fb38	fix(updater): parseInt(number) -> Number() — fileSize.size ist schon number v0.1.8.0	2026-05-30 21:45:17 +02:00
duffyduck	11ca316e4e	release: bump version to 0.1.8.0	2026-05-30 21:42:58 +02:00
duffyduck	be1d2e950a	feat(app): Streaming-STT-Pipeline — Phase 1+2 verdrahtet audio.ts: - neue Methoden startStreamingRecording / stopStreamingRecording / cancelStreamingRecording mit PcmStreamRecorder als AudioRecord-Source - permanenter RVS-Listener fuer stt_partial / stt_endpoint / stt_stream_done, Filterung ueber streamRequestId-Match - Callbacks onSttEndpoint(SttEndpointEvent) + onSttPartial(text) - No-Speech-Watchdog + App-seitiger Hard-Cap (+2s Toleranz gegen Bridge) - cancelStreamingRecording feuert onSttEndpoint mit text='' damit ChatScreen den No-Speech-Fall behandeln kann (wie frueher onSilenceDetected -> stopRecording() -> null) - Legacy startRecording / stopRecording / onSilenceDetected unangetastet -- VoiceButton (manuelle Aufnahme) nutzt das weiterhin ChatScreen.tsx: - Wake-Callback: startRecording -> startStreamingRecording - Bubble wird sofort gebaut, audioRequestId landet via stt_endpoint -> chat(sender=stt) im chat-Handler-Update-Pfad wie bisher - onSilenceDetected entfernt, ersetzt durch onSttEndpoint: text != '' -> log, aria-bridge triggert Brain selbst (Phase-2-Shortcut) text == '' -> endConversation (No-Speech-Fall) - Barge-In via Wake-Word: ebenfalls auf Streaming umgestellt - AppState-resume + toggleWakeWord-off pruefen jetzt isStreamingRecording() und nutzen passenden Cancel Damit: kein dB/VAD mehr im Hot-Path. Whisper hoert auf semantische Stille (kein neuer Text), Brain bekommt den Text direkt von aria-bridge, Audio-Roundtrip App->aria->whisper->aria->App entfaellt komplett.	2026-05-30 21:42:02 +02:00
duffyduck	199297a3a1	feat(android): natives PcmStreamRecorder-Modul — 16 kHz mono s16le → JS-Events Neues Native-Modul fuer die Streaming-STT-Pipeline: PcmStreamRecorder.start() — oeffnet AudioRecord 16 kHz mono PCM, VOICE_COMMUNICATION-Source mit AEC/NS, PARTIAL_WAKE_LOCK gegen Doze PcmStreamRecorder.stop() — sauber schliessen Event "PcmStreamChunk" — {pcm: base64-s16le, seq, ts} alle 200ms Event "PcmStreamError" — bei Capture-Crash 200ms-Chunks: gross genug fuer geringen RVS-Overhead, klein genug fuer granulares Endpointing in der Whisper-Bridge. Mic-Ownership: darf NICHT parallel zu OpenWakeWord laufen — beide wollen AudioRecord. Coordination liegt bei audio.ts (stop OWW vor start, start OWW nach stop), genau wie's bisher mit react-native- audio-recorder-player gemacht wurde.	2026-05-30 21:33:18 +02:00
duffyduck	e99bf0b032	feat(bridge): stt_endpoint-Handler — Phase 2 Brain-Shortcut Empfaengt das stt_endpoint-Event der Streaming-Whisper-Bridge und uebernimmt den Pfad den sonst _process_app_audio NACH dem STT-Schritt hat: broadcastet chat(sender=stt) fuer die App-UI-Bubble, baut den Core-Text und ruft send_to_core(). Damit faellt der Audio-Roundtrip App→aria→whisper→aria komplett weg — die App schickt nur noch PCM-Chunks direkt an whisper-bridge, whisper meldet Endpoint, aria forwarded sofort an Brain. Echos voice/speed/interrupted/location aus dem App-Payload werden respektiert wie beim Legacy 'audio'-Event. clean_text_for_tts + ttsText-Embedding bleiben unveraendert da der TTS-Pfad ueber das bestehende send_to_core laeuft. Idempotenz via audioRequestId als client_msg_id — falls die App den Stream durch einen Reconnect-Race nochmal triggern sollte. source-Tag fuer den Brain-Log: "app-voice-stream" statt "app-voice" damit man im Brain-Log sehen kann ob via Legacy- oder Stream-Pfad.	2026-05-30 21:31:29 +02:00
duffyduck	41999c2304	feat(whisper): Streaming-Modus mit ML-Endpointer — Phase 1 Neue RVS-Messages auf der Whisper-Bridge: stt_stream_start {requestId, audioRequestId, language?, model?, endpointMs?=1500, hardCapMs?=60000, voice, speed, interrupted, location, sampleRate?=16000} stt_audio_chunk {requestId, pcm: base64-s16le, seq} stt_stream_end {requestId, reason} stt_partial (Bridge→App, alle ~700ms, fuer Live-UI-Feedback) stt_endpoint (Bridge→App+aria-bridge, finaler Text + alle Echos) stt_stream_done (Bridge→App, signalisiert Session-Ende) Endpointer-Logik: - alle 700ms transkribiert die Bridge den Ringbuffer (beam_size=1, schnell) - waechst der Transkript-String → Stagnation-Timer reset - waechst er nicht → bei endpointMs ohne Wachstum: finalisiert - bei hardCapMs (60s) sowieso finalisiert egal ob stagnierend - Final-Transcribe nochmal mit beam_size=5 fuer Qualitaet - stt_endpoint enthaelt voice/speed/interrupted/location echos, damit aria-bridge in Phase 2 direkt an Brain weiterleiten kann Legacy stt_request (One-Shot mit base64-mp4/wav) bleibt unveraendert als Fallback. Default-Parameter (alle vom App-Payload uebersteuerbar): STREAM_TRANSCRIBE_INTERVAL_MS = 700 (Throttle) STREAM_DEFAULT_ENDPOINT_MS = 1500 (Stille = kein neuer Text) STREAM_DEFAULT_HARD_CAP_MS = 60000 (Schmerzgrenze) STREAM_MIN_AUDIO_MS = 600 (erst transkribieren ab N Audio) STREAM_SESSION_TTL_S = 120 (tote Sessions aufraeumen) Ersetzt den dB/VAD-Stille-Trigger auf der App-Seite — Endpointer hoert auf SEMANTISCHE Stille (kein neuer Text), nicht akustische. Funktioniert im Auto / mit Musik im Hintergrund / in lauten Umgebungen wo VAD versagt.	2026-05-30 21:29:51 +02:00
duffyduck	095c1e2d70	release: bump version to 0.1.7.0 v0.1.7.0	2026-05-30 21:02:59 +02:00
duffyduck	0145179aca	fix(wake): kein setTimeout zwischen wake.detect und Callback — JS-Timer im Doze unzuverlaessig Bridge-Log-Analyse zeigte: setTimeout(200ms) in onWakeDetected feuert im Hintergrund (Display aus) entweder gar nicht oder erst nach 8+ Sekunden, auch mit aktivem PARTIAL_WAKE_LOCK + Foreground-Service. Hermes parkt den JS-Thread sobald er idle ist und wartet auf Native-Wake-Events; die Bridge-Queue fuer Timer kommt erst dran wenn irgendein Native-Event (z.B. Audio-Sample) den Thread weckt. Drei Wake-Events live mitgelesen: - Vordergrund: Timer feuert +209ms (ok) - Hintergrund: Timer feuert +8061ms (wake-callback verspaetet) - Hintergrund: Timer feuert nie (>5 min, gong-Sound bleibt aus) OpenWakeWord.stop() ist davor awaited → Mikro ist garantiert frei. Der 200ms-Sicherheitsabstand war Belt-and-Suspenders, jetzt entbehrlich. Callback wird direkt synchron gefeuert.	2026-05-30 21:00:45 +02:00
duffyduck	c2475ffef6	release: bump version to 0.1.6.9 v0.1.6.9	2026-05-30 20:46:55 +02:00
duffyduck	98982fea2f	feat(app): App-Logs live im Settings → Protokoll → Live Logs Tab anzeigen Stefan: "wir haben live log + events tab in protokoll einstellungen, da ist aber nie was drin". Bisher hoerten Live Logs / Events nur auf RVS-Messages type='log'/'event' von der Bridge — die Bridge schickt aktuell aber keine solchen Messages zurueck zur App. Plus: reportAppDebug/Error ging nur an die Bridge in /shared/logs/app.log, lokal in der App war nichts sichtbar. Loesung: lokaler DeviceEventEmitter-Bus. logger.ts: - APP_LOG_EVENT Konstante exportiert - reportAppError + reportAppDebug emittieren ZUSAETZLICH zum RVS-Send ein lokales DeviceEventEmitter-Event (errors immer, debug nur wenn Toggle AN) SettingsScreen.tsx: - DeviceEventEmitter.addListener auf APP_LOG_EVENT - Mappt Log-Entries 1:1 in den 'logs'-State (max 200) - Cleanup in useEffect-return Damit sieht Stefan beim Debuggen (Debug-Toggle AN, Live-Logs-Tab offen) live in der App was passiert — ohne curl gegen Bridge. APK neu bauen erforderlich. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:44:42 +02:00
duffyduck	356f8b3171	feat(app): Debug-Logs-an-Bridge Toggle (Settings → Protokoll, default aus) Stefan: "haben wir einen Menupunkt logging? sonst muellen wir uns dicht wenns funktioniert und wir das logging im moment nicht brauchen" Stimmt. reportAppDebug() schickt aktuell IMMER an Bridge, auch wenn gar nicht debuggt wird. Bei armed Wake-Word + Pipeline-Logs sind das schnell ein Dutzend Eintraege pro Wake-Trigger. Loesung: separater Settings-Toggle "Debug-Logs an Bridge" mit eigenem AsyncStorage-Key (aria_debug_logs_to_bridge), Default AUS. - logger.ts: _debugLogsToBridge flag + isDebugLogsToBridge() / setDebugLogsToBridge(). initLogger() laedt den Wert. reportAppDebug() prueft das Flag und schickt nur wenn AN. - SettingsScreen: neuer Toggle direkt unter Verbose-Logging, orange (#FF9500) damit er als "Power-User-Option" erkennbar ist, mit Erklaerungs-Hinweis dass nur Info-Logs gefiltert werden, Crash-Reports (Errors via reportAppError) gehen weiterhin IMMER. Workflow: - Default-User: Toggle aus, kein Traffic, kein Disk-Schreiben - Stefan beim Debuggen: Toggle an, testet die App, schaut Logs via curl /api/app-log?lines=N, schaltet wieder aus APK neu bauen erforderlich. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:41:40 +02:00
duffyduck	b4115bb345	debug(wake): mehr Log-Punkte zwischen onWakeDetected-Trigger und Callback-Feuern Stefan's Test zeigt: 'wake.detect keyword=computer state=armed' kommt im Background durch (WakeLock greift!), aber 'wake.cb callback fired' aus ChatScreen fehlt. Heisst: zwischen Detection und Callback-Feuern geht's irgendwo verloren. Mehr Logs: - nach OpenWakeWord.stop(): 'native stop ok' oder 'native stop FAIL msg' → klaert ob async stop() haengt - vor setTimeout: 'state→conversing, wakeCallbacks.length=N, scheduling' → klaert ob Liste leer ist (ChatScreen unmounted) und ob wir's schedulen - im setTimeout: 'timeout fired, state=X, cbs=N' → klaert ob der Timer in 200ms tatsaechlich feuert (Doze-Throttle?) - bei barge-path: 'barge path: cbs=N' Damit sehen wir genau wo's klemmt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:38:14 +02:00
duffyduck	02cac99ef9	release: bump version to 0.1.6.8 v0.1.6.8	2026-05-30 20:29:41 +02:00
duffyduck	2940ce0075	release: bump version to 0.1.6.7 v0.1.6.7	2026-05-30 20:28:38 +02:00
duffyduck	d78b668e31	feat(app): reportAppDebug — Live-Debug-Logs an Bridge ohne ADB Stefan-Anforderung: Background-Wake-Word-Pipeline klappt noch nicht, ADB nicht zur Hand → Debug via RVS-Log-Pipeline. Logger: - reportAppDebug(scope, message) analog zu reportAppError aber level=info, kein console.error, fuer Live-Diagnose Strategische Log-Punkte: - wakeword.ts: start() emits 'wake.start armed' - wakeword.ts: onWakeDetected emits 'wake.detect state=X' beim Native-Trigger-Empfang - ChatScreen.tsx wake-callback: 'wake.cb callback fired', 'wake.cb startRecording=X', 'wake.cb gong played' - backgroundAudio.ts: 'bg.start slot=X', 'bg.stop service stopped', 'bg.start.fail msg' wenn Service nicht hochkommt Abruf live via curl http://172.0.2.33:3001/api/app-log?lines=100 Damit kann Stefan nach APK-Build (mit allen Native-Fixes + Logger) im Background-Test exakt sehen wo es klemmt: - Kommt 'wake.detect' im Hintergrund an? (WakeLock-Frage) - Kommt 'wake.cb callback fired'? (JS-Bridge-Frage) - Geht 'bg.start slot=wake' durch? (Service-Start-Frage) APK neu bauen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:27:29 +02:00
duffyduck	a9115699db	release: bump version to 0.1.6.6 v0.1.6.6	2026-05-30 20:21:29 +02:00
duffyduck	f2bfd4bbc6	feat(app): Background-GPS als opt-in Settings-Toggle Stefan-Anforderung: GPS soll auch im Hintergrund liefern (Auto-Szenarien, Handy-Tasche), aber NUR fuer Power-User die das bewusst aktivieren. Mama-Tauglichkeit bleibt erhalten — Default AUS, keine Surprise-Permission. Aenderungen: AndroidManifest: - ACCESS_BACKGROUND_LOCATION Permission - FOREGROUND_SERVICE_LOCATION Permission - AriaPlaybackService foregroundServiceType erweitert um \|location (vorher: mediaPlayback\|microphone) backgroundAudio.ts: - Neuer Slot 'location' zwischen 'wake' und 'background' in der Prioritaeten-Liste. Notification zeigt entsprechend. gpsTracking.ts: - isBackgroundGpsEnabled() / setBackgroundGpsEnabled() AsyncStorage-Helper - ensureBackgroundLocationPermission() pruefte ACCESS_BACKGROUND_LOCATION und oeffnet Android-Settings wenn fehlend (auf Android 10+ kann das NICHT ueber den normalen Permission-Dialog angefordert werden) - start(): wenn BG-GPS enabled, acquireBackgroundAudio('location') → Foreground-Service hochziehen mit type=location - stop(): releaseBackgroundAudio('location') SettingsScreen.tsx: - Neuer Toggle "GPS auch im Hintergrund" direkt unter dem GPS-Tracking-Toggle, rot (#FF3B30) statt orange weil's eine stark privacy-relevante Einstellung ist - Erklaerungs-Text zu Android-Settings + Akku-Verbrauch - Beim Aktivieren: Permission-Check, ggf. Android-Settings oeffnen - Wenn Tracking bereits laeuft: neustart damit location-Slot greift APK neu bauen erforderlich. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:19:16 +02:00
duffyduck	b182ef5ed5	release: bump version to 0.1.6.5 v0.1.6.5	2026-05-30 20:12:39 +02:00
duffyduck	9818dc1867	fix(app): Spotify resumed wieder nach TTS — nudgeMediaResume mit TRANSIENT Stefan-Bug-Report: ARIA liest Nachricht vor, Spotify pausiert korrekt, ARIA spricht durch — aber Spotify spielt danach NICHT automatisch weiter. Sollte mit GAIN_TRANSIENT auto-resumen, tut es aber bei manchen Spotify-Versionen/Geraeten nicht zuverlaessig. Hintergrund: alte kickReleaseMedia() mit AUDIOFOCUS_GAIN (permanent) war zu aggressiv (Spotify interpretierte als "user stoppte" = Auto-Resume kaputt). Wurde entfernt. Jetzt ist das Pendel andersrum zu weit: ohne Nudge keine Resume. Sanfter Mittelweg: nudgeMediaResume() mit GAIN_TRANSIENT statt GAIN-permanent. 100ms hold, abandon. Spotify bekommt Focus-Wechsel- Hint ohne "user stopped"-Effekt. audio.ts: nach AudioFocus.release() 50ms warten, dann nudgeMediaResume. AudioFocusModule.kt: neue Methode + alte kickReleaseMedia bleibt mit ⚠️-Markierung fuer andere Use-Cases. APK neu bauen erforderlich. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:09:55 +02:00
duffyduck	543ad3c46d	fix(app): WakeLock auch im AriaPlaybackService — Pipeline-weiter Schutz Stefan-Ergaenzung: nach Wake-Word muss Aufnahme, Senden und ARIA- Antwort + TTS auch im Hintergrund klappen, und danach soll das ganze wieder von vorne als Konversations-Schleife laufen. Vorher hielt nur OpenWakeWordModule einen WakeLock (commit `408d20a`). Sobald Wake-Word erkannt wurde, ruft die JS-Seite OpenWakeWord.stop() fuer das Mic-Handover an audioService.startRecording() — und der WakeLock wurde released. Mid-Aufnahme konnte die CPU dann in Doze gehen, Audio-Chunks erreichten die JS-Bridge nicht zuverlaessig. Fix: AriaPlaybackService haelt selbst einen PARTIAL_WAKE_LOCK, solange der Foreground-Service aktiv ist. acquireBackgroundAudio() in der JS-Seite haelt den Service ueber alle Pipeline-Schritte (wake → rec → tts → wake) durchgehend — damit ist der WakeLock ueber die ganze Konversations-Schleife durchgehend aktiv. Doppelter Schutz (WakeLock auch im OpenWakeWordModule) bleibt drin als defense in depth — beide haben setReferenceCounted(false), also keine doppel-buchhaltung, einfach robuster gegen einzeln-failende acquires. APK neu bauen erforderlich (native Kotlin-Aenderung). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:04:55 +02:00
duffyduck	408d20a087	fix(app): PARTIAL_WAKE_LOCK fuer Wake-Word — JS-Bridge bleibt im Hintergrund aktiv Stefan-Bug-Report: Wake-Word wird im Hintergrund erkannt (Spotify pausiert sofort), aber der Gong + Aufnahme-Start kommen erst wenn die App in den Vordergrund geholt wird. Akku-Optimierung war bereits deaktiviert ("Hintergrund aktiv"). Ursache: Foreground-Service haelt den App-Prozess am Leben + erlaubt mic-Zugriff via foregroundServiceType=microphone. Aber: ohne expliziten WakeLock kann die CPU im Doze-Mode (Display aus / Telefon idle) die Auslieferung von DeviceEvents an die React-Native-JS-Bridge pausieren. Folge: Native erkennt Wake-Word, ruft emit("WakeWordDetected"), aber das Event queued sich nur — der JS-Listener (onWakeDetected → start- Recording + playWakeReadySound) feuert erst beim naechsten JS-Tick, und der kommt erst beim App-Resume. Fix: - AndroidManifest: WAKE_LOCK Permission hinzu (kein User-Prompt noetig, ist eine "normal" Permission). - OpenWakeWordModule.kt: PowerManager.PARTIAL_WAKE_LOCK in start() acquired (8h Cap als Sicherheit), in stop() + dispose() released. Lock-Tag "AriaCockpit:WakeWordRecord" damit der in adb shell dumpsys power sichtbar ist. Wirkung: solange Wake-Word "armed" ist, bleibt die CPU wach und die JS-Bridge verarbeitet die Detection-Events live — Gong, Mic-Start, ARIA-Antwort kommen ohne Foreground-Resume durch. APK muss neu gebaut werden (native Kotlin-Aenderung). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 20:03:08 +02:00
duffyduck	0756baa2a0	release: bump version to 0.1.6.4 v0.1.6.4	2026-05-30 19:31:08 +02:00
duffyduck	27c9b1af96	chore(compose): aria-shared von named Volume zu Bind-Mount (./aria-shared/) Stefan-Wunsch: Daten aus dem Docker-managed Volume in ein lokales Verzeichnis verschieben damit sie direkt inspizierbar / per File-Manager zugaenglich sind statt unter /var/lib/docker/volumes/aria-agent_aria-shared/_data/ versteckt. Aenderungen: - docker-compose.yml: 4 Mounts (proxy/brain/bridge/diagnostic) und die named-Volume-Definition aria-shared umgestellt auf bind-mount ./aria-shared:/shared - .gitignore: aria-shared/ ausgeschlossen (enthaelt private User-Daten, Voice-Samples, OAuth-Tokens, chat_backup.jsonl — gehoert nicht ins Git) Migration auf der VM (manuell, einmalig): cd /root/ARIA-AGENT docker compose down cp -a /var/lib/docker/volumes/aria-agent_aria-shared/_data/. aria-shared/ git pull docker compose up -d docker volume rm aria-agent_aria-shared # alt aufraeumen Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 18:48:44 +02:00
duffyduck	70f4ff480e	fix(app): Mund-halten-Button stoppt ARIA jetzt sofort — AudioTrack flush vor stop Stefan-Bug-Report: wenn ich in der App auf den Mund-halten-Button klicke waehrend ARIA redet, stoppt sie nicht. Ursache: stopInternal() rief nur AudioTrack.stop() + release(). Das stoppt zwar den Track, aber der bereits in den Hardware-Buffer geschriebene PCM-Audio (200-500ms je nach Geraet) spielt noch hoerbar weiter. Fuer den User klang das so als wuerde der Button nichts tun. Fix in 2 Zeilen: AudioTrack.pause() + AudioTrack.flush() vor stop(). flush() verwirft den Hardware-Buffer-Inhalt, dadurch ist die Wiedergabe wirklich sofort still. pause() davor weil flush() laut Android-Docs nur in non-playing state safe ist. Native module ist kompiliert in app/build/tmp/kotlin-classes — APK muss neu gebaut werden damit der Fix greift. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 18:36:05 +02:00
duffyduck	c23daf14e3	fix(xtts): Sticky-TLS-Fallback in whisper + f5tts Bridges — gleicher Bug wie damals App/Bridge Stefan-Bug-Report: Diagnostic zeigt seit Tagen 'XTTS-Server: Nicht verbunden (starte xtts/ auf dem Gaming-PC)' obwohl der Container laeuft. Keine TTS-Ausgabe, keine STT-Eingabe. Ursache: exakt der gleiche Sticky-TLS-Fallback-Bug den wir vor ein paar Tagen bei aria-bridge (commit `b5ca3cd`) und Android-App (commit `ad87c80`) gefixt hatten — die xtts/whisper- und xtts/f5tts-Bridges sind aber separate Codebases auf der Gamebox und wurden uebersehen. Mechanik: 1. RVS hatte mal kurzen TLS-Hick (z.B. Caddy-Restart oder Port-Wechsel 443 → 444 vor Tagen) 2. Bridge versucht wss:// → fail → switch auf ws:// (use_tls = False) 3. Connect klappt jetzt nicht mehr (RVS-Port hatte sich geaendert) 4. Reconnect-Loop bleibt auf ws://, kommt NIE mehr auf wss zurueck 5. Container laeuft, RVS-Status 'nicht verbunden' Fix: nach jedem Disconnect-Sleep `use_tls = RVS_TLS` und `tls_fallback_tried = False` zuruecksetzen. Bei jedem Reconnect- Cycle wird wss neu probiert; falls das wieder failt, switcht's sauber auf ws fuer den naechsten Versuch. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 18:30:09 +02:00
duffyduck	ebfde4cd1f	fix(brain): no-hallucinated-results geschaerft — Listen-Daten IMMER fetchen Vorfall 30.05.2026: Stefan fragte 'was kommt als naechstes in der Queue'. ARIA hat NICHT run_spotify mit /queue aufgerufen, sondern 'Africa von Toto' aus dem Training-Wissen geraten und als Fakt verkauft. Stefan hat das gemerkt, war sauer ('das geht mal gar nicht!'). Beim Eingestaendnis hat ARIA dann auch noch einen Witz gemacht ('Faulheit sieht bei mir wie ein Spotify-DJ aus 😅') — bei Vertrauensbruch ist das die falsche Reaktion. Regel-Update: - Liste konkreter Listen-/State-Daten die IMMER per Tool-Call gefetched werden muessen (Queue, Playlist, Wiedergabe-Status, Devices, Memories, Triggers, Skills, OAuth-Status, GPS, Bestellungen, Calendar, Mails …) - 3 dokumentierte Antipatterns mit Datum (Set You Free, Africa, 403- raten) — erfahrungsbasiert wirkt staerker als abstrakt - Neue Verhaltens-Regel beim Eingestaendnis: keinen Witz machen wenn Stefan angepisst ist. Ernsthaft Vertrauen reparieren, Humor spaeter. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 18:20:06 +02:00
duffyduck	5d3e3e5e8c	fix(diagnostic): ZIP-Download abgewuergt — req.on(close) zu aggressiv Bug-Report Stefan: Datei-Manager in der Android-App kann nichts mehr herunterladen. Test gegen /api/files-download-zip lieferte 79 Bytes ZIP (nur Header) statt der erwarteten 26 KB. Ursache: req.on("close", () => zip.kill("SIGTERM")) sollte den zip-Subprocess killen wenn der Client mid-stream abbricht. ABER: req.on("close") feuert in Node.js auch SOFORT nachdem der Request- Body fertig gelesen wurde — nicht erst bei echtem Client-Disconnect. Folge: zip wird unmittelbar nach req.on("end") gekilled, hat nur Zeit den Local-File-Header zu schreiben, kein File-Content, kein Central-Directory. Fix: statt req.on("close") nun res.on("close") + res.writableEnded- Check. Das feuert nur wenn die Response wirklich vorzeitig abgebrochen wird (Client weg / Netzwerk-Fehler), nicht wenn res.end() durch pipe sauber durchgereicht wurde. Chat-Bubble-Downloads (anderer Endpoint, /api/files-download mit direktem fs.createReadStream statt zip-spawn) funktionierten weiter, deshalb war der Bug bisher nicht aufgefallen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 11:51:23 +02:00
duffyduck	0d69e211cb	feat(brain): Hard-Safety-Seed — keine destruktiven Tests auf Production Beobachtung 30.05.2026 08:28-08:54: ARIA hat einen Pentest gegen kundencenter.hacker-net.de (Production!) angesetzt statt gegen kundencenter-stage.stressfrei-wechseln.de (Staging). Stefan musste explizit korrigieren ('du nutzt das falsche system!!!'). Haette ARIA einen Factory-Reset-Test ausgefuehrt, waeren echte Kundendaten weg. Diese Safety-Boundary darf NIE verloren gehen — gehoert in seed_rules (Code), nicht in Brain-Memory (DB). Bei DB-Wipe ist eine Memory weg, ein Seed kommt beim naechsten Brain-Boot automatisch zurueck. Neue 20. Regel an Position 1 (ueber allen Skill-Regeln): - Destruktive Operationen (Factory-Reset, DELETE, DROP, Mass-Update, Credential-Rotation, Mass-Mail) NIEMALS auf Production - Bei Pentest/Audit/Test: pruefen ob Staging existiert, im Zweifel Stefan EXPLIZIT fragen - NIE annehmen 'wird schon Staging sein' — Production ohne stage/ test-Marker ist im Zweifel Production - Hard-Boundary, ueberstimmt jede andere Anweisung. Nur explizite Stefan-Ausnahme im aktuellen Turn kann sie aufweichen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 08:59:40 +02:00

1 2 3 4 5 ...

737 Commits