ARIA-AGENT

Author	SHA1	Message	Date
duffyduck	62018b3e51	revert(audio): kickReleaseMedia raus — bricht Spotify's Auto-Resume Logs zeigen jetzt KEINEN haengenden RNSound-Focus mehr (Library-Version oder Sound-Lifecycle hat sich geaendert). Der Kick mit AUDIOFOCUS_GAIN (permanent) sagte Spotify "user hat manuell etwas anderes gestartet" → Spotify resumed nicht automatisch. Ohne Kick: unser Focus war AUDIOFOCUS_GAIN_TRANSIENT (USAGE_ASSISTANT) — beim release bekommt Spotify einen sauberen GAIN nach TRANSIENT-Loss und resumed automatisch. Native kickReleaseMedia bleibt fuer den Fall dass es nochmal gebraucht wird, wird aber nicht mehr gerufen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 17:24:55 +02:00
duffyduck	f023ba0ac5	fix(audio): Mute-Button = Stop fuer aktuelle Antwort, nie Resume Bisheriges Verhalten: Mute drueckt → stopPlayback. Mute zurueck → noch eingehende chunks der gleichen Antwort starteten einen neuen Stream und ARIA redete weiter wo sie war. Funktionierte nur 2x weil dann isFinal schon kam und keine chunks mehr fluten. Stefan: "Mund verbieten = Stop, fertig". Neue Antworten sollen normal spielen. Fix: _stoppedMessageId-Tracking. Bei Mute=true wird die aktuelle msgId gemerkt — alle weiteren chunks dieser msgId bleiben silent, auch wenn Mute zurueckgenommen wird. Reset bei neuer msgId. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 17:20:29 +02:00
duffyduck	facde1fef7	fix(audio): kickReleaseMedia auch im PCM-Pfad — re-renderte Antworten muteten Spotify dauerhaft Stefan: ältere Nachrichten (deren Cache-WAV weg ist) gehen ueber tts_request neu rendern → kommen als PCM-Stream zurueck → werden ueber PcmStreamPlayer abgespielt. Beim Mute lief stopPlayback aber ohne den Spotify-resume-Kick weil hadRnSound=false war (kein currentSound). Jetzt: kickReleaseMedia immer in stopPlayback rufen — kostet nichts, deckt PCM- und RNSound-Pfad ab. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 17:13:12 +02:00
duffyduck	3bc490b485	fix(audio): stopPlayback idempotent — kein doppelter Focus-Kick Re-Renders / setInterval(loadSettings) triggern setMuted(true) oft mehrfach hintereinander → jeder weitere stopPlayback rief erneut kickReleaseMedia, Spotify pausierte+resumte mehrfach (Stefan: "spielt kurz und pausiert dann wieder"). Fix: stopPlayback returnt sofort wenn nichts mehr aktiv ist. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 17:02:01 +02:00
duffyduck	b1eaf42fef	fix(audio): Spotify resumed nach Mute — RNSound's haengenden Focus loesen Logs zeigten: react-native-sound requestet beim Sound.play() einen EIGENEN AudioFocus mit USAGE_MEDIA, released den aber bei Sound.stop()/ release() NICHT (bekanntes RN-sound-Bug). Spotify sieht den haengenden Media-Focus → bleibt pausiert. Workaround: Native-Methode kickReleaseMedia() macht einen request+abandon- Cycle mit USAGE_MEDIA, das System raeumt damit den Focus-Stack auf und Spotify bekommt sauberen GAIN-Event. stopPlayback ruft das jetzt nach Sound.release() wenn vorher ein RNSound aktiv war. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 16:57:52 +02:00
duffyduck	fb9e5dcd10	feat(logger): Verbose-Logging-Toggle in Settings → Protokoll console.log wird global stummgeschaltet wenn aus — spart adb-logcat- Speicher wenn alles laeuft. console.warn/error bleiben immer aktiv. Default an. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 16:52:25 +02:00
duffyduck	1088bff43d	fix(chat): Play-Button rendert neu wenn Cache-Datei weg Vorher: Button checkte nur ob audioPath gesetzt ist — auf eine geloeschte Cache-Datei hat aber nichts geprueft. playFromPath warntete nur und returnte stumm. Jetzt wird VOR playFromPath die Existenz geprueft, sonst geht's ueber tts_request an die Bridge zum Neu-Rendern. Plus: Logs in Sound.play-Callback und _releaseFocusDeferred fuer den "Spotify resumed nicht nach Replay"-Bug. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 16:42:38 +02:00
duffyduck	50b10c8ac0	feat(audio): Cache-Cleanup beim App-Start + TTS-Cache-Settings-Button - App-Start raeumt orphane aria_tts_*.wav (>5min) aus dem Cache — Wiedergaben die durch Anruf/Mute/Barge-In abgebrochen wurden hinterliessen sonst Files, weil der completion-Callback nicht feuert. - Neuer Settings-Button "TTS-Cache leeren" mit Live-Groessenanzeige — parallel zum bestehenden "Update-Cache leeren". Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 16:36:01 +02:00
duffyduck	632e1e4fa1	fix(audio): pauseForCall setzt isPlaying zurueck — Playback nach Anruf nicht mehr tot pauseForCall stoppte zwar currentSound + setzte ihn auf null, hat aber isPlaying=true gelassen. Folge: nach dem Anruf war jeder weitere Play- Button-Klick wirkungslos, weil playAudio bei isPlaying=true den _playNext-Pfad ueberspringt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 16:28:42 +02:00
duffyduck	8f64f8fb30	fix(phone): 800ms-Delay vor Auto-Resume — Spotify kommt zum Atmen Wenn ARIA's Resume-Pfad direkt nach Anruf-Ende den AudioFocus requestet, kollidiert das mit Spotify's eigenem Auto-Resume. System haengt noch im IN_CALL-Mode-Uebergang, Spotify sieht "Loss → Loss" und bleibt pausiert statt kurz zu resumen. Mit 800ms-Delay: Spotify schafft den Resume-Schritt, dann pausiert ARIA wieder ordnungsgemaess. Wenn ARIA nichts pending hatte, bleibt Spotify einfach weiter an. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 16:20:48 +02:00
duffyduck	31aa82b68c	debug+fix(audio): Mute-Logs + resumeSound auch in stopPlayback stoppen stopPlayback stoppte bisher nur currentSound, nicht resumeSound — wenn nach einem Anruf der Auto-Resume laeuft und der User Mute drueckt, bleibt der Resume-Sound weiter spielen. Plus Logs in setMuted/stopPlayback um zu sehen warum Stefans Mute beim Replay nicht greift. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 15:55:51 +02:00
duffyduck	f5970ce700	fix(audio): _firePlaybackStarted ueberschrieb playFromPath-Tracking mit leerem pcmMessageId Logs zeigten: playFromPath setzt currentPlaybackMsgId='db710ff3-...', 9s spaeter beim Anruf war captureInterruption msgId=(leer). Ursache: _firePlaybackStarted setzt currentPlaybackMsgId blind aus pcmMessageId — das ist beim Play-Button leer. Jetzt nur noch setzen wenn ein PCM-Stream laeuft. Play-Button und Resume- Sound setzen ihr Tracking selber im Caller. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 15:44:28 +02:00
duffyduck	3dcd2ae0b4	fix(audio): msgId-Regex liberaler — auch nicht-UUID-Dateinamen werden erkannt Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 15:36:43 +02:00
duffyduck	2dfd21d1d0	fix(audio): Play-Button setzt jetzt auch Wiedergabe-Tracking — Anruf-Test via Playback funktioniert Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 15:22:21 +02:00
duffyduck	9d9ddc730b	debug+fix(audio): mehr Anruf-Logs + Tracking auch beim Resume-Sound Im Test 2 (zweiter Anruf in derselben Antwort) kam weder captureInterruption noch resumeFromInterruption als Log — beide returnen frueh ohne Hinweis warum. Jetzt loggen sie auch den Skip-Pfad damit man sieht ob's der idempotent-Guard oder fehlende playbackStartTime ist. Plus: _playFromPathAtPosition aktualisiert jetzt currentPlaybackMsgId und playbackStartTime — sonst stehen die auf den Werten der ersten TTS-Wiedergabe und ein zweiter Anruf-captureInterruption wuerde mit veraltetem Stand laufen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 15:20:43 +02:00
duffyduck	175dcdf225	fix(audio): Auto-Resume nach Anruf — pcmBuffer bleibt erhalten Logs zeigten "WAV nicht binnen 30000ms verfuegbar" — pcmBuffer wurde von haltAllPlayback geleert, isFinal schrieb daher eine leere WAV (oder gar keine, weil pcmMessageId leer war). Neue Methode pauseForCall (statt haltAllPlayback im Anruf-Pfad): - AudioTrack stoppt + AudioFocus release (Spotify resumed) - pcmBuffer + pcmMessageId BLEIBEN — Bridge-Chunks werden weiter gesammelt - _pausedForCall macht weitere Chunks "silent" (kein writeChunk, nur Cache) - isFinal schreibt WAV trotz Anruf → resumeFromInterruption findet sie Plus captureInterruption idempotent gemacht: ringing→offhook ueberschreibt die Position vom ersten Halt nicht mehr (Date.now-Tracking laeuft stumpf weiter obwohl Audio gestoppt ist — der erste Halt ist die echte Position). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 15:11:46 +02:00
duffyduck	f066a2a555	fix(audio): Mute-Button stoppt jetzt auch laufenden PCM-Stream pcmStreamActive wurde beim isFinal-Chunk schon auf false gesetzt, der AudioTrack spielte aber noch aus seinem Buffer (kann sekundenlang sein). stopPlayback() uebersprang darum PcmStreamPlayer.stop() — ARIA redete weiter obwohl Spotify schon resumed war. Fix: stop() immer rufen, der Flag-Check faellt weg (ist eh idempotent). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 14:39:27 +02:00
duffyduck	73b7a76ea8	fix(phone-call): kein VoIP-Toast bei Play-Button — AudioMode pruefen Stefan: 'Möchte ich mir playbacks anhören egal welches kommt die toast nachricht voip anruf und danach aria wieder aktiv'. Ursache: AUDIOFOCUS_LOSS feuert bei jedem Audio-Player-Wechsel (Spotify, andere Apps, sogar unsere eigenen Sound-Calls). Wir interpretierten das blind als VoIP-Anruf. Fix: vor dem Halt fragen wir AudioFocus.getMode() ab — nur wenn mode == 2 (IN_CALL) oder 3 (IN_COMMUNICATION) ist's wirklich ein Anruf. Bei NORMAL (0) wird der Loss ignoriert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 13:43:40 +02:00
duffyduck	4feaacc7e4	feat(update): APK-Cache robuster + manueller 'Update-Cache leeren' Button Stefan: 'app blaeht sich auf durch heruntergeladene Update-Versionen'. updater.ts: - cleanupOldApks durchsucht jetzt 4 Pfade (Caches, Documents, ExternalCaches, ExternalDir) statt nur CachesDirectoryPath - Public gemacht + returnt {removed, freedMB} - getApkCacheSize() neu — listet count + totalMB SettingsScreen → Speicher: - Neue Sektion 'Update-Cache' mit Live-Groessenanzeige - Button 'Update-Cache leeren' triggert cleanup + Toast mit Ergebnis - Beim Mount wird die Groesse einmal geladen Auto-Cleanup laeuft weiterhin beim App-Start + vor jedem Download — der Button ist fuer den Notfall (haengender Download, alte Pfade, defekte APKs). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 12:49:22 +02:00
duffyduck	97442198ec	fix(audio): neue ARIA-Antwort verwirft pending Auto-Resume Stefans Edge-Case: waehrend des Telefonats stellt der User eine neue Text-Frage. Die neue ARIA-Antwort startet sofort (offhook→offhook loest keinen halt aus). Vorher haette resumeFromInterruption nach Anruf-Ende noch die ALTE Antwort (die unterbrochen wurde) ab Position spielen wollen — Konflikt mit der neuen Antwort. Fix: in _handlePcmChunkImpl beim Wechsel zu einer neuen messageId: - laufenden resumeSound stoppen - pausedMessageId = '' wenn != neue messageId Damit gewinnt immer die neueste Antwort. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 12:39:33 +02:00
duffyduck	e3e841f2ab	feat(audio): Auto-Resume nach Anruf ab der gemerkten Position Stefans Idee: Position beim Halt merken (Date.now() - playbackStart - leadingSilence), nach dem Auflegen ab da weitermachen. Wenn der Cache noch nicht komplett ist (final-Marker kam waehrend Anruf), warten wir bis zu 30s auf das WAV — meistens ist's schon da weil das Telefonat laenger als die Antwort dauerte. audio.ts: - captureInterruption(): merkt position + messageId, returnt Sekunden - resumeFromInterruption(maxWaitMs): wartet auf WAV-Cache, lädt mit Sound, setCurrentTime(position), play - Tracking-Felder: playbackStartTime, currentPlaybackMsgId, pausedX phoneCall.ts: - _haltForCall ruft captureInterruption() VOR haltAllPlayback - _resumeAfterCall triggert resumeFromInterruption(30s) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 12:37:35 +02:00
duffyduck	33185de42b	fix(audio): AudioFocus erst beim NATIVEN Playback-Finished-Event released Logcat-Befund: 12:22:54.860 — final-Chunk + Cache geschrieben 12:22:55.402 — abandonAudioFocus (~0.5s spaeter) 12:22:55 — Spotify resumed (Atlas: TotalTime 93s) 12:23:27.064 — Playback fertig (32s spaeter!) → ARIA spricht 32s parallel zu Spotify weil end() viel zu frueh returnt. Stefans 'Spotify resumed obwohl ARIA noch redet'. Fix: - PcmStreamPlayerModule emittiert 'PcmPlaybackFinished' RN-Event nach dem finally{}-Block im Writer-Thread (= AudioTrack hat alle Samples wirklich durchgespielt) - audioService subscribed im constructor → ruft erst dann _releaseFocusDeferred() - _handlePcmChunkImpl bei isFinal triggert NICHT mehr direkt das Release — nur die playbackFinished-Listener (UI-Logic) So bleibt Spotify pausiert bis ARIA tatsaechlich fertig ist, egal wie viel Audio im AudioTrack-Buffer wartet. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 12:29:55 +02:00
duffyduck	4d0b9e0d78	fix: dB-Range -85, Mute haert auch laufende TTS, VoIP-Anrufe + Bild-Bubble Bug 1 — dB-Range erweitert: VAD_SILENCE_DB_MIN von -55 auf -85 dB. Damit hat Stefan einen weiten Regler-Spielraum wenn die adaptive Auto-Erkennung in seiner Umgebung nicht zuverlaessig greift. Bug 5 — Mute-Button stoppt laufende TTS nicht: audioService bekommt jetzt einen internen _muted-Flag. handlePcmChunk setzt silent automatisch wenn _muted true ist, playAudio kehrt frueh zurueck. Verhindert Race zwischen User-Klick auf Mute und einem TTS-Chunk der im selben JS-Tick ankommt (vorher: Ref-Update via useEffect erst nach dem Re-Render → Chunks "rutschten durch"). Plus ttsCanPlayRef wird im toggleMute-Handler synchron aktualisiert. Bug 4 — VoIP/Messenger-Anrufe erkennen: AudioFocusModule emittiert jetzt "AudioFocusChanged" Events mit type "loss"/"loss_transient"/"gain". WhatsApp/Signal/Discord/etc. requestn AudioFocus_GAIN_TRANSIENT_EXCLUSIVE wenn ein Anruf reinkommt — wir fangen das in phoneCall.ts ab und rufen halt + pauseForCall genau wie beim klassischen Anruf. Plus getMode() Polling-Fallback (alle 3s) weil GAIN nicht zuverlaessig kommt wenn wir den Focus selbst released haben — sobald AudioMode wieder NORMAL ist, resumeFromCall. Bug 6 — Bilder als "Strich": attachmentImage hatte width: '100%' in einer Bubble mit maxWidth: '80%' ohne explizite Parent-Breite → RN rendert auf 0px Breite. Neue ChatImage- Komponente nutzt Image.getSize um die echte aspectRatio zu messen + setzt sie dynamisch. Bubble passt sich dem Bild an. Bugs 2 (lange Texte mid-cutoff) + 3 (Spotify resumed) — brauchen ADB-Logs. ADB-WLAN ueber 192.168.177.22:5555 schlaegt fehl (refused) — bei Android 11+ braucht's Wireless-Debugging-Pairing-Code. Stefan kann den nennen sobald er soweit ist. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 10:28:52 +02:00
duffyduck	5bdcc3c65b	feat(vad): Stille-Pegel manuell in Settings + Info-Modal Wenn die adaptive Baseline-Logik in einer Umgebung nicht zuverlaessig greift (Stefan: "manchmal funktioniert die Stille-Erkennung nicht"), kann der User die Schwelle jetzt manuell setzen. Settings → Spracheingabe: - "Stille-Pegel (dB)" mit −1/+1 Buttons + "Auf automatisch zuruecksetzen" - Range −55 bis −15 dB, default "auto" (= adaptive Baseline) - Info-Icon (i) oeffnet Modal mit Erklaerung: • dB-Skala (negativ, naeher 0 = lauter) • Faustregel-Pegel mit Farb-Code (−45 sensibel, −38 ausgewogen, −25 robust) • Klarstellung "niedrigere Zahl = sensibler" audio.ts: - VAD_SILENCE_DB_OVERRIDE_KEY in AsyncStorage - loadVadSilenceDbOverride() liefert null oder Zahl - startRecording: wenn Override gesetzt, Adaptive-Baseline uebersteuert. Speech-Schwelle wird auf Override + 10 dB gesetzt. Toast zeigt "VAD: manuell stille>-XX dB" Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-07 08:24:26 +02:00
duffyduck	52795530f9	fix(audio): Wake-Word-Anruf-Pause + Resume-Cooldown + Background-Mic-Order Bug 4 — Wake-Word laeuft bei Anruf weiter: phoneCall ruft jetzt wakeWordService.pauseForCall bei RINGING/OFFHOOK und resumeFromCall bei IDLE. Telefonie-App belegt das Mikro waehrend des Anrufs, openWakeWord muss daher pausieren. Pre-Call-State wird gemerkt — armed bleibt armed, conversing degraded zu armed (sonst landet der User nach Auflegen in einem halben Dialog). Bug 3 — App-Resume triggert faelschlich Wake-Word: Beim Wechsel von Background nach Foreground gibt's Audio-Pegel-Spikes (AudioFocus-Switch, AudioTrack re-route), die openWakeWord als Wake- Word interpretiert. Neuer Cooldown-Mechanismus: AppState-Listener im ChatScreen ruft wakeWordService.setResumeCooldown(1500) — Detections in der Phase werden in onWakeDetected verworfen. Bug 1 — Background-Aufnahme klappt nicht: acquireBackgroundAudio('rec') wird jetzt VOR audioService.startRecorder gerufen, acquireBackgroundAudio('wake') VOR OpenWakeWord.start. Sonst greifen Androids Background-Mic-Restrictions (ab 11+) — der Service mit foregroundServiceType=microphone muss zum Zeitpunkt des AudioRecord- Starts schon aktiv sein, nicht erst per state-change-Listener asynchron danach. Bug 2 (VAD manchmal nicht): nicht in diesem Commit, vermutlich umgebungsabhaengig. Toast zeigt die kalibrierten Schwellen — wenn das nochmal auftritt, schick mir die Werte. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-07 07:49:02 +02:00
duffyduck	d6b54d3247	feat(audio): Background-Service auch fuer Wake-Word + Aufnahme + Doku-Split Erweitert den Foreground-Service um den microphone-Type damit nicht nur TTS, sondern auch Wake-Word-Lauschen und aktive Aufnahmen weiterlaufen wenn die App im Hintergrund ist. Slot-System (backgroundAudio.ts): - 'tts' : ARIA spricht - 'rec' : Aufnahme laeuft - 'wake' : Wake-Word lauscht passiv (Ohr aktiv) Mehrere Slots koennen unabhaengig acquired/released werden, der Service laeuft solange mindestens einer aktiv ist. Notification-Text passt sich dynamisch an den hoechstprioren Slot an (tts > rec > wake). Wiring (ChatScreen): - onPlaybackStarted/Finished → 'tts' Slot - audioService.onStateChange (recording) → 'rec' Slot - wakeWordService.onStateChange (off→armed/conversing) → 'wake' Slot AndroidManifest: - foregroundServiceType="mediaPlayback\|microphone" (Pflicht ab Android 14 fuer Background-Mic-Zugriff) - FOREGROUND_SERVICE_MICROPHONE Permission Doku: - issue.md Erledigt-Sektion in "Bugs / Fixes", "App Features" und "Infrastruktur" gesplittet - README: Background-Service-Beschreibung erweitert Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 23:43:24 +02:00
duffyduck	ead28cf09a	feat(audio): Foreground-Service haelt TTS am Leben bei minimierter App ARIAs Antwort wird jetzt auch dann fertig vorgelesen wenn der User die App im Hintergrund schickt. Vorher hat Android den Prozess kurz nach dem Minimieren eingefroren — TTS verstummte mitten im Satz. Native: - AriaPlaybackService.kt: Service mit foregroundServiceType=mediaPlayback, zeigt persistente Notification "ARIA spricht — antippen oeffnet die App" (channel low-priority, ongoing, tap → MainActivity) - BackgroundAudioModule.kt: RN-Bridge mit start()/stop() - AndroidManifest: FOREGROUND_SERVICE + FOREGROUND_SERVICE_MEDIA_PLAYBACK + POST_NOTIFICATIONS Permissions, Service deklariert JS: - backgroundAudio.ts: idempotenter Wrapper (active-Flag verhindert doppelte start/stop calls) - ChatScreen onPlaybackStarted → startBackgroundAudio - ChatScreen onPlaybackFinished → stopBackgroundAudio - audio.ts stopPlayback ruft auch stopBackgroundAudio damit die Notification bei Cancel/Barge-In/Anruf nicht haengen bleibt Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 23:37:46 +02:00
duffyduck	da5579038e	fix(vad): adaptive Baseline robuster — minimum + Cap-Bereich Bug: Wenn beim Aufnahmestart sofort gesprochen wurde (z.B. Wake-Word- Echo noch im Mikro) ODER der Hintergrund vorruebergehend laut war, verschob die avg-basierte Baseline die Stille-Schwelle so weit nach oben, dass normale Hintergrundgeraeusche dauerhaft als "Sprache" zaehlten — VAD feuerte nie, Aufnahme lief unendlich. Fix: - Baseline = MINIMUM der 5 Samples statt Mittelwert (ruhigster Moment) - Cap auf sinnvollen Bereich: - Silence-Schwelle: -50dB bis -28dB (vorher unbegrenzt) - Speech-Schwelle: -40dB bis -18dB - Erweitertes Log: zeigt sowohl raw als auch geclamp-te Werte Damit gibt's keine "tote" VAD-Konfiguration mehr — selbst wenn die Baseline-Messung Schrott ist, bleiben die Schwellen praktikabel. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 23:05:08 +02:00
duffyduck	6651f5937d	feat(audio): Wake-Word parallel zu TTS mit AcousticEchoCanceler Du kannst jetzt "Computer" sagen waehrend ARIA noch redet — TTS verstummt, neue Aufnahme startet. Vorher musste man warten oder manuell den Voice-Button tappen. Native (OpenWakeWordModule.kt): - AudioRecord-Source von MIC auf VOICE_COMMUNICATION (aktiviert auf den meisten Geraeten Echo-Cancellation + Noise-Suppression) - Zusaetzlich AcousticEchoCanceler/NoiseSuppressor/AutomaticGainControl explizit aktiviert wenn vorhanden — robuster auf Geraeten wo die VOICE_COMMUNICATION-Source die Effects nicht automatisch mitbringt - releaseAudioEffects() im stop/dispose JS (wakeword.ts): - Neue API: startBargeListening / stopBargeListening — Wake-Word parallel aktivieren, ohne den State 'conversing' zu verlassen - onWakeDetected unterscheidet jetzt: in 'conversing' → barge-in- Callback (nicht der normale wake-callback). Sonst Standard-Pfad. - onBargeIn-Subscriber-API + isBargeListening-Getter Lifecycle-Wiring (audio.ts + ChatScreen): - audioService.onPlaybackStarted callback (neu) - ChatScreen: Bei TTS-Start → wakeWord.startBargeListening - ChatScreen: Bei TTS-Ende → wakeWord.stopBargeListening (sonst kein AudioRecord fuer die naechste Aufnahme) - ChatScreen: Bei BargeIn → haltAllPlayback + cancel_request + 150ms-Pause + neue Aufnahme starten issue.md + README aktualisiert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 22:50:09 +02:00
duffyduck	97cb7be313	feat(audio): "Bereit"-Sound (Ding-Dong) wenn Mikro nach Wake-Word offen ist Kurzer akustischer Hinweis (Airplane Ding-Dong, 20KB MP3) bei audioService.startRecording-Erfolg im Wake-Word-Pfad — User weiss exakt ab wann er reden darf, statt das Toast nur zu sehen. Quelldatei: android/sounds/Airplane-ding-dong.mp2 → ffmpeg-konvertiert zu MP3 64kbps, abgelegt in android/app/src/main/res/raw/ damit Android sie als Resource laden kann. Toggle in App-Settings → Wake-Word, default aktiv. Bei Aktivierung spielt direkt eine Vorschau ab damit man weiss wie's klingt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 22:40:45 +02:00
duffyduck	77e927ffcd	fix(audio): Placeholder-Race per audioRequestId + Mikro-Offen-Toast erst nach Start Bug: Bei zwei Sprachnachrichten kurz hintereinander wurde der STT-Text der zweiten in die Bubble der ersten geschrieben. Ursache: findIndex matchte ueber Substring "Spracheingabe wird verarbeitet" → bei zwei offenen Placeholders nahm er immer die ERSTE, egal welches STT-Result gerade kam. Fix: jede Aufnahme bekommt eine eindeutige audioRequestId, App pusht sie in die Placeholder-Bubble + ans audio-Event. Bridge gibt sie unveraendert ans STT-Result zurueck. App matcht primaer per ID, fallback auf Substring (Kompatibilitaet zu alten Bridge-Versionen). Bonus: Toast "Wake-Word erkannt" entfernt, dafuer "🎤 Mikro offen — sprich jetzt" erst wenn audioService.startRecording wirklich erfolgreich war. So weiss der User exakt ab wann er reden darf — vorher war der Toast schon ~400ms vorher da. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 22:33:26 +02:00
duffyduck	31ff20c846	feat: Max-Aufnahmedauer konfigurierbar + Barge-In gibt aria-core Kontext Max-Aufnahme: Default rauf von 2 auf 5 Minuten, in den App-Settings konfigurierbar zwischen 1 und 30 Minuten (loadMaxRecordingMs aus AsyncStorage, Storage-Key aria_max_recording_sec). Notbremse-Verhalten bleibt: nach Ablauf wird die Aufnahme automatisch beendet und gesendet. Barge-In Kontext: Wenn der User waehrend ARIA noch redet/arbeitet eine neue Sprach- oder Text-Nachricht sendet, geht jetzt ein 'interrupted: true' Flag mit. Bridge praefixed den Text fuer aria-core dann mit: "[Hinweis: Stefan hat dich gerade unterbrochen waehrend du noch gesprochen oder gearbeitet hast. Folgendes ist eine Korrektur, Ergaenzung oder ein Themenwechsel zu deiner letzten Antwort.]" So weiss ARIA dass die neue Message KEINE eigenstaendige Folgefrage ist sondern auf den abgebrochenen Run bezogen. Der User sieht in seinem Chat nur den reinen Text — der Hint geht nur an aria-core. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 21:58:11 +02:00
duffyduck	406f4cb3cc	fix: Textauswahl, adaptive VAD-Schwelle + Barge-In bei Sprachaufnahme Bug 1 — Textauswahl in Bubbles ging nicht mehr: MessageText hatte verschachtelte <Text onPress={...}> fuer Custom-Link- Styling. Das fing die Long-Press-Geste ab, daher kein Markieren+Kopieren mehr. Jetzt nur noch ein einzelnes <Text selectable dataDetectorType="all">, Android macht URLs/Telefonnummern/Emails per System-Detection klickbar. Bug 2 — VAD erkannte Stille nicht zuverlaessig (Aufnahme lief endlos): Festwerte (-45dB Stille / -28dB Sprache) passten nicht zu jeder Umgebung. In lauteren Raeumen lag der Hintergrundpegel ueber der Stille-Schwelle, lastSpeechTime wurde dauerhaft aktualisiert → VAD feuerte nie, Aufnahme lief bis 120s Max-Duration. Jetzt adaptiv: erste 5 Mic-Samples (~500ms) bilden die Baseline; Stille- Schwelle = baseline+6dB, Sprache-Schwelle = baseline+12dB. Toast zeigt die kalibrierten Werte beim Aufnahmestart. Fallback auf -38dB/-22dB falls das Mikro keine Metering-Updates liefert. Bug 3 — Barge-In ("ach vergiss es"): Wenn waehrend ARIAs Antwort eine neue Sprachnachricht aufgenommen wird, wird ARIAs aktuelle Aktivitaet (TTS + thinking/tool) sofort abgebrochen bevor die neue Message gesendet wird — wie in einem echten Gespraech wo man den anderen unterbrechen darf. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 21:49:48 +02:00
duffyduck	fec8aa977b	feat(audio): TTS pausiert bei Anruf + Conversation-Focus haelt Spotify durchgehend gepaust Bug 1a — Anruf-Pause: Neues PhoneCallModule.kt nutzt TelephonyCallback (API 31+) bzw. PhoneStateListener (Pre-12) um auf RINGING/OFFHOOK/IDLE zu reagieren. Bei Klingeln/Gespraech ruft phoneCall.ts → audioService.haltAllPlayback, ARIA verstummt sofort. READ_PHONE_STATE Permission wird beim ersten Start angefragt; ohne Permission failt der Listener leise. Bug 1b — Spotify-Resume: AudioFocus wird jetzt an den Conversation-Lifecycle gekoppelt statt an einzelne Streams. Solange wakeWordState 'conversing' ist, blockt acquireConversationFocus() jeden per-Stream-Release. Erst beim Wechsel auf 'armed'/'off' darf der Focus tatsaechlich freigegeben werden. Verhindert das "Spotify kommt nach 10s wieder hoch"-Phaenomen auch ueber Render-Pausen + zwischen mehreren ARIA-Antworten hinweg. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-03 21:44:58 +02:00
duffyduck	309df9d851	fix(wake-word): Embedding-Output ist rank-4, nicht rank-2 — Trigger funktioniert jetzt Hauptursache warum kein Wake-Word je triggerte: das Google-Speech- Embedding-Modell liefert (1,1,1,96), nicht (1,96). Der Cast `as Array<FloatArray>` warf eine ClassCastException, die vom try/catch geschluckt wurde — Pipeline lief still ins Leere. Zusaetzlich: - WW-Input-Frame-Count wird jetzt aus den Modell-Metadaten gelesen (variiert pro Keyword; hey_jarvis=16, computer_v2evtl. anders) - "Computer" als Wake-Word erweitert (Community-Modell aus fwartner/home-assistant-wakewords-collection) "ARIA" als Wake-Word: gibt's nicht fertig trainiert. Muesste ueber das openWakeWord Colab-Notebook trainiert werden (~1h auf gratis-GPU). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-26 13:24:47 +02:00
duffyduck	55cfb752a2	feat(app): Wake-Word komplett on-device via openWakeWord (ONNX) Picovoice/Porcupine raus — neuer Stack ist openWakeWord (Apache 2.0, on-device, ONNX Runtime). Kein API-Key, keine Lizenzgebuehren, Audio verlaesst das Geraet nicht. Eigene Wake-Words sind via openWakeWord- Notebook gratis trainierbar. Pipeline (alles im OpenWakeWordModule.kt): 1. AudioRecord 16kHz mono int16 in 1280-Sample-Chunks (80ms) 2. melspectrogram.onnx → 32-mel Frames (mel/10 + 2 wie in Python) 3. embedding_model.onnx, 76-Frame Sliding Window (stride 8) → 96-dim 4. hey_jarvis.onnx (oder anderes Keyword) auf letzten 16 Embeddings 5. Sigmoid-Score, threshold/patience/debounce-Filter 6. RN-Event "WakeWordDetected" raus Mitgelieferte Modelle in assets/openwakeword/: hey_jarvis (Default), alexa, hey_mycroft, hey_rhasspy. Externe Service-API (start/stop/ configure/onWakeWord/...) bleibt identisch — ChatScreen unveraendert. build.gradle: com.microsoft.onnxruntime:onnxruntime-android:1.17.1 package.json: @picovoice/porcupine-react-native + voice-processor raus SettingsScreen: AccessKey-Feld weg, neue Keyword-Liste mit Labels README: Wake-Word-Sektion komplett umgeschrieben (kein Picovoice mehr) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-26 12:56:33 +02:00
duffyduck	44d2c6b4fe	fix(app): Spotify-Bounce zwischen ARIA-Antworten + Wake-Word-Doku AudioFocus wird jetzt mit 800ms Verzoegerung freigegeben — wenn ARIA direkt eine zweite Antwort hinterherschickt oder das Recording ins TTS uebergeht, wird das Release abgebrochen. Spotify/YouTube haben damit keine Mikro-Sekunden-Luecke mehr zum Hochkommen waehrend ARIA spricht. README: neue Sektion zur Wake-Word-Einrichtung mit Picovoice (7-Tage-Trial, Console-Link, Anleitung fuer eigene Keywords) und veraltete Wake-Word-Limitation entfernt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 22:49:45 +02:00
duffyduck	be373466a3	fix: klares UI-Feedback fuer Wake-Word-State Stefan's Verwirrung: Ohr-Button + KEIN Porcupine = Direkt-Aufnahme, nicht passives Lauschen. Wenn er lange wartet, schnappt das Mikro Hintergrundgeraeusche/Sprache auf, sendet ab, Ohr aus. Sah aus wie "Wake-Word triggerte" — war aber stinknormales Recording. Fixes fuer klares Feedback: - Toast bei jedem State-Wechsel: * Direkt-Aufnahme (kein Porcupine): "Wake-Word nicht aktiv — direkte Aufnahme startet (Mikro hoert mit)" * armed: "Lausche auf X..." * Wake erkannt: "Wake-Word X erkannt — sprich jetzt" * endConversation: "Lausche wieder auf X" oder "Mikro aus" - Ohr-Button-Icon zeigt drei States: 🔇 off 👂 armed (Porcupine lauscht passiv) 🎙️ conversing (aktive Aufnahme laeuft) - ChatScreen subscribed wakeWordService.onStateChange fuer Live- Updates des Icons. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 20:34:07 +02:00
duffyduck	bbf9aed3ba	fix: 4 Bugs — STT-Mapping, Speed-Logging, VAD-Logs, Wake-Word-Toast Bug 2: STT-Result ueberschrieb beide noch unaufgeloeste Audio-Bubbles mit gleichem Text. Fix: nur die ERSTE matchende Bubble aktualisieren (findIndex + index-Update statt map). Reihenfolge ist FIFO weil Whisper sequenziell verarbeitet. Bug 3: Speed-Param wird nun in jedem Hop geloggt: - ChatScreen: "[Chat] sende mit voice=X speed=Y" - aria-bridge: "XTTS-Request gesendet (voice=X, speed=Y.YYx)" - f5tts-bridge: "F5-TTS: N Satz(e), voice=X, speed=Y.YYx" Damit kann man im logcat/docker-logs eindeutig sehen wo speed evtl. verloren geht oder ob die Stimme einfach von Natur aus schnell ist. Bug 4: VAD-Trigger-Reason mit Schwelle: "VAD NNN ms Stille (Schwelle=NNN ms)". Plus startRecording loggt jetzt VAD-Stille + MAX-Recording. Bug 1 (Porcupine): mehr Debug + Toast-Meldungen. - init failure: err.name/code/stack ins Log - start() ohne Porcupine: Toast "Access Key in Settings setzen" - start() Fehler: Toast mit Fehlermeldung - configure(): Toast wenn init scheitert - Erfolgreiches arming: Toast "Lausche auf X" Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 20:28:46 +02:00
duffyduck	23ca815cb2	fix: handlePcmChunk serialisiert — fixes Race bei kurzen Streams Bei kurzen Saetzen (nur ein paar Chunks + sofort final) konnten die async handlePcmChunk-Calls parallel laufen. Der final-Chunk konnte native end() aufrufen BEVOR der vorherige Chunk seinen native start() abgeschlossen hatte. Der Writer-Thread startete dann mit endRequested bereits true, verarbeitete keine Chunks sauber → Audio ging verloren. Fix: Wrapper chaint alle Chunk-Calls an eine Promise-Queue: _pcmChunkQueue = Promise.resolve() handlePcmChunk → _pcmChunkQueue.then(() => _handlePcmChunkImpl(p)) So werden start/writeChunk/end garantiert in der richtigen Reihenfolge verarbeitet. Der API-Contract bleibt (gleiches return-Promise). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 11:58:27 +02:00
duffyduck	cd89e36ec2	fix: alte APKs im Cache werden jetzt aufgeraeumt Die heruntergeladenen Update-APKs (~20-30MB pro Release) landeten in CachesDirectoryPath und wurden nie geloescht. Bei regelmaessigen Updates sammelt sich das auf mehrere 100MB an. Fix: cleanupOldApks() wird gerufen - einmal beim App-Start (Constructor) — alte APKs sind sowieso nicht mehr relevant, die aktuelle Version laeuft ja aus dem System - vor jedem neuen Download — falls jemand zwei Updates in einer Session zieht Loescht alle *.apk Dateien im CachesDirectoryPath und loggt die freigemachte Groesse pro Datei. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 01:22:22 +02:00
duffyduck	7919489543	feat: Pre-Roll-Buffer kann jetzt auf 0 (sofort abspielen) F5-TTS ist schnell genug dass der Puffer bei kurzen Saetzen eher schadet als nuetzt — er verzoegert den play()-Start fuer Sekunden die dann als Wartezeit auffallen. Aenderungen: - audio.ts: TTS_PREROLL_MIN_SEC 1.0 → 0 (Einstellbar in Settings) - PcmStreamPlayerModule.kt: MIN_PREROLL_SECONDS auf 0.0, Fallback- Logic respektiert jetzt 0 als gueltigen Wert (vorher hat der .let { if (it > 0) it else DEFAULT } 0 zu 3.5s umgebogen). Bei preroll=0 greift der Leading-Silence von 200ms immer noch, d.h. AudioTrack-Startup bleibt sauber. play() wird dann beim allerersten echten PCM-Chunk aufgerufen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 01:02:48 +02:00
duffyduck	e7bb6c37cb	feat: Sprechgeschwindigkeit-Range auf 0.1-5.0 erweitert TTS_SPEED_MIN 0.5 → 0.1, TTS_SPEED_MAX 2.0 → 5.0. Bridge-seitige Validierungen (aria_bridge.py + f5tts/bridge.py) mit- gezogen auf den gleichen Bereich. Hinweis: Extremwerte (unter 0.5 oder ueber 2.0) koennen bei F5-TTS verzerrte Ausgaben produzieren — Stefan bekommt die Freiheit zum Experimentieren. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 00:49:05 +02:00
duffyduck	d146ca92c4	fix: Aufnahme-Crashes/Double-Tap durch VAD-Multi-Fire + stale closure Drei zusammenhaengende Bugs: 1. VAD-Timer feuerte im 200ms setInterval WEITER nachdem die Stille- Schwelle erreicht war — listeners wurden pro Aufnahme bis zu 5x getriggert. Parallel laufende stopRecording()-Calls lieferten audio-recorder-player's nativen Layer OOM / Crash. Fix: silenceFired-Latch + Timer-Clear SOFORT beim ersten Feuer (fireSilenceOnce-Helper). Gleiche Logik fuer Max-Dauer + Conv-Window. 2. VoiceButton silence-listener re-registrierte bei jedem isRecording- Flip (deps [isRecording, onRecordingComplete]). Closure-State war stale, und bei schnellen flips gabs register/unregister-Races. Fix: empty deps, state direkt vom audioService via getRecordingState() lesen. onRecordingComplete via Ref (damit der Callback aktuell bleibt ohne re-register). 3. handleTap las den Button-State aus React (isRecording), der bei schnellen Taps stale sein konnte — "erst zweiter Tap geht" Symptom. Fix: audioService.getRecordingState() als Source-of-Truth, plus tapBusy-Ref als Anti-Doppel-Tap-Guard waehrend asyncer start/stop. 'processing'-State wird korrekt ignoriert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 00:47:53 +02:00
duffyduck	9e12e0001c	debug: Logs fuer Auto-Playback-Bug — canPlay + silent-state sichtbar Stefan berichtet dass Auto-Playback trotz Closure-Fix nicht greift. Zwei neue Log-Zeilen die beim naechsten Test direkt zeigen was schief laeuft: - ChatScreen: "[Chat] audio-msg canPlay=X (enabled=Y muted=Z)" - audio.ts: "[Audio] PCM-Stream start: silent=X messageId=Y ..." Ausreichend um zu unterscheiden: * canPlay=false trotz Mund-an → ttsMuted bleibt im State haengen * canPlay=true aber silent=true in audio.ts → Ref-Bug oder race * silent=false aber nichts hoerbar → native-module oder audio-routing Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 00:38:22 +02:00
duffyduck	190352820c	feat: Bug-Runde + 5 App/Diagnostic-Features Bugs: - App Mute-/Auto-Playback: onMessage-Closure hielt stale ttsDeviceEnabled/ ttsMuted → Mute wurde ignoriert + AsyncStorage-Load kam nicht durch. Fix via ttsCanPlayRef (live gespiegelt) statt Closure-Variablen. - App Zombie-Recording: toggleWakeWord hat die laufende Aufnahme nicht gestoppt → audioService.recordingState blieb 'recording' → normaler Aufnahme-Button wirkungslos. Fix: await stopRecording() vor stop(). - Porcupine robuster: BuiltInKeywords-Enum Mapping mit String-Fallback, errorCallback fuer Runtime-Crashes (state zurueck auf off statt App-Crash), mehr Logging damit man beim naechsten Issue debuggen kann. App-Features: - MessageText Komponente: Text ist durchgehend selektierbar, erkennt URLs (http/https), E-Mails, Telefonnummern und macht sie anklickbar (oeffnet Browser / Mail-App / Android-Dialer via Linking). - TTS-Wiedergabegeschwindigkeit pro Geraet einstellbar (Settings -> "Sprechgeschwindigkeit", 0.5-2.0 in 0.1-Schritten, Default 1.0). Wird als speed-Param an die F5-TTS-Bridge durchgereicht. Bridge-Durchreichen: - ChatScreen: speed aus AsyncStorage via ttsSpeedRef, an chat/audio/ tts_request mitgeschickt - aria-bridge: _next_speed_override wie voice_override, an xtts_request weitergereicht - f5tts-bridge: speed-Param an F5TTS.infer() durchgereicht Diagnostic-Feature: - Voice-Preview-Button (Play-Icon) vor dem Delete-X in der Stimmen-Liste - Modal mit Textfeld (Default-Beispieltext wird bei jedem Oeffnen neu gesetzt) und Play-Button - Server sammelt audio_pcm Frames der Preview-Anfrage, baut WAV, schickt base64 zurueck, Browser spielt im <audio>-Tag ab - 60s Timeout-Safety-Net Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 00:24:02 +02:00
duffyduck	22fa4b3ccf	feat: Porcupine Wake-Word Integration (Built-In Keywords, "Jarvis" default) WakeWordService wrappt jetzt Picovoice Porcupine: - loadFromStorage(): Access Key + Keyword aus AsyncStorage, init Porcupine - configure(key, keyword): Settings-Wechsel, Re-Init - start(): wenn Porcupine bereit → 'armed' (passives Lauschen), sonst Fallback auf direktes 'conversing' (klassischer Modus) - onWakeDetected: Porcupine pausieren → 'conversing' → wakeCallback - endConversation: Porcupine wieder starten → 'armed' (Wake-Word weiter aktiv im Hintergrund, kein erneuter Tap noetig) - Pro Geraet eigene Wahl: jeder User kann sein eigenes Wake-Word haben Settings: neuer Bereich "Wake-Word" - Picovoice Access Key Input (mit Eye-Toggle), kostenlos auf console.picovoice.ai - Built-In Keyword Chips: jarvis, computer, picovoice, porcupine, bumblebee, terminator, alexa, hey google, ok google, hey siri - "Speichern + Aktivieren" Button mit Status-Feedback - Hinweis dass "ARIA" Custom-Keyword spaeter via Diagnostic kommt ChatScreen: ruft wakeWordService.loadFromStorage() beim Mount. package.json: @picovoice/porcupine-react-native + react-native-voice-processor hinzugefuegt — npm install + native rebuild noetig. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 15:23:51 +02:00
duffyduck	1b8a51aad0	feat: Conversation-Window — Gespraech endet nach Stille statt Endlos-Loop Der Gespraechsmodus war bisher ein Endless-Loop: Mikro hat sich nach jeder ARIA-Antwort wieder geoeffnet bis MAX_RECORDING_MS, danach Speech- Gate verworfen und neu starten. Das Ohr blieb ewig an. Neue Logik: audio.ts: startRecording(autoStop, noSpeechTimeoutMs?) — wenn der User innerhalb des Timeouts nicht anfaengt zu sprechen, wird Stille gemeldet → stopRecording → Speech-Gate verwirft → result=null. wakeword.ts: drei States off/armed/conversing. start() geht direkt in 'conversing' (kein Wake-Word verfuegbar; Stub fuer spaetere Porcupine- Integration). endConversation() bei No-Speech. ChatScreen: Aufnahme bekommt das Window aus AsyncStorage durchgereicht. Bei null-Result → endConversation, UI-State synchron. Settings: neuer +/- Block "Konversations-Fenster" 3-20s (Default 8). Mit dem Stub ist die Architektur bereit fuer Porcupine: dann geht endConversation auf 'armed' statt 'off' und der Wake-Word-Detector laeuft passiv weiter. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 15:14:01 +02:00
duffyduck	0a04972455	feat: Stille-Toleranz fuer Aufnahme einstellbar in App-Settings Neuer +/- Block in SettingsScreen → Spracheingabe → "Stille-Toleranz", 1.0-8.0s, Default 2.8s. Wert in AsyncStorage (aria_vad_silence_sec). audio.ts liest den Wert beim Aufnahme-Start und nutzt ihn fuer den VAD-Auto-Stop-Schwellwert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 14:44:17 +02:00
duffyduck	e64df23bb7	fix: TTS pausiert andere Apps statt zu ducken + VAD/Mic laenger AudioFocus.requestDuck nutzt jetzt AUDIOFOCUS_GAIN_TRANSIENT (statt TRANSIENT_MAY_DUCK) — Spotify/YouTube pausieren komplett solange ARIA spricht und kommen nicht mitten drin wieder hoch. PcmStreamPlayer.end() resolved jetzt erst wenn der native Writer-Thread wirklich fertig ist (alle Samples aus dem Pre-Roll-Puffer ausgespielt). audio.ts wartet entsprechend, bevor AudioFocus.release() gerufen wird — behebt das "Musik dreht hoch waehrend Antwort noch laeuft"-Problem. Mic-Aufnahme: VAD_SILENCE_DURATION_MS 1800 → 2800ms (mehr Toleranz fuer Sprechpausen), MAX_RECORDING_MS 30s → 120s (laengere Erklaerungen moeglich, Notbremse bleibt). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 14:40:58 +02:00

1 2

71 Commits