ARIA-AGENT

Author	SHA1	Message	Date
duffyduck	db4c7b9b72	release: bump version to 0.1.0.5	2026-05-10 17:02:56 +02:00
duffyduck	dd6d70c46e	release: bump version to 0.1.0.4	2026-05-10 16:59:15 +02:00
duffyduck	b1eaf42fef	fix(audio): Spotify resumed nach Mute — RNSound's haengenden Focus loesen Logs zeigten: react-native-sound requestet beim Sound.play() einen EIGENEN AudioFocus mit USAGE_MEDIA, released den aber bei Sound.stop()/ release() NICHT (bekanntes RN-sound-Bug). Spotify sieht den haengenden Media-Focus → bleibt pausiert. Workaround: Native-Methode kickReleaseMedia() macht einen request+abandon- Cycle mit USAGE_MEDIA, das System raeumt damit den Focus-Stack auf und Spotify bekommt sauberen GAIN-Event. stopPlayback ruft das jetzt nach Sound.release() wenn vorher ein RNSound aktiv war. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 16:57:52 +02:00
duffyduck	f95e71463f	release: bump version to 0.1.0.3	2026-05-10 16:43:37 +02:00
duffyduck	cad68db2a2	release: bump version to 0.1.0.2	2026-05-10 16:38:00 +02:00
duffyduck	a8b586ec92	release: bump version to 0.1.0.1	2026-05-10 16:30:14 +02:00
duffyduck	7e12816ebd	release: bump version to 0.1.0.0	2026-05-10 16:22:08 +02:00
duffyduck	b857f778e9	release: bump version to 0.0.9.9	2026-05-10 15:56:53 +02:00
duffyduck	de8eeb69e2	release: bump version to 0.0.9.8	2026-05-10 15:46:36 +02:00
duffyduck	981779cd9e	release: bump version to 0.0.9.7	2026-05-10 15:37:45 +02:00
duffyduck	2750b867a3	release: bump version to 0.0.9.6	2026-05-10 15:29:03 +02:00
duffyduck	77ccee8331	release: bump version to 0.0.9.5	2026-05-10 15:13:38 +02:00
duffyduck	160c5c34b6	release: bump version to 0.0.9.4	2026-05-10 14:54:45 +02:00
duffyduck	43c21d3ddc	release: bump version to 0.0.9.3	2026-05-10 14:48:35 +02:00
duffyduck	b73c6c346e	fix(gps): Standort-Permission anfordern — sonst sendet App nie eine Position Im Manifest fehlte ACCESS_COARSE/FINE_LOCATION komplett, und der Settings-Toggle requestete keine Runtime-Permission. Geolocation .getCurrentPosition() schlug darum lautlos fehl, App sendete nie ein location-Feld → Diagnostic konnte nichts anzeigen, auch wenn der Diagnostic-eigene "GPS einblenden"-Toggle aktiv war. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 14:47:35 +02:00
duffyduck	b91ddc5bdf	fix(audio): AudioTrack-Start-Threshold auf 100ms — kurze TTS startet jetzt ENDLICH die Wurzel: AudioTrack hat seit API 31 setStartThresholdInFrames(), default ist bufferSize/2. Bei 4s-Buffer = 2s Threshold — Track wartet bis 2s im Buffer sind, sonst startet play() nie wirklich (pos bleibt 0). Bei 3 Worten (~1.4s) kommt's nie ueber die Schwelle. Threshold runter auf 100ms (2400 Frames @ 24kHz) — Track laeuft sofort mit erstem Chunk an. Erklaert auch warum genau ab 9 Worten (~3s+) der Pre-Roll-Pfad lief: dann wurde die 2s-Schwelle ueberschritten. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 14:45:05 +02:00
duffyduck	7d08c06720	release: bump version to 0.0.9.2	2026-05-10 14:40:35 +02:00
duffyduck	b55b0e7c42	fix(audio): play() beim 1. Chunk — kurze Texte stallen nicht mehr Logs zeigten: Pre-Roll-Pfad (play() WAEHREND chunks reinkommen) lief immer sauber, Kurz-Text-Pfad (play() NACHDEM Buffer komplett gefuellt ist) stallte immer — egal mit wie viel Daten oder welchem USAGE-Tag. Fix: play() beim allerersten data-chunk callen, kein Pre-Roll-Threshold mehr. AudioTrack ist sofort im PLAYING-State, weitere chunks/trailing fliessen parallel ab. Padding-Block nach mainLoop entfaellt komplett. USAGE_MEDIA wieder auf USAGE_ASSISTANT zurueck — war nicht die Ursache. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 14:38:02 +02:00
duffyduck	70f806ef80	release: bump version to 0.0.9.1	2026-05-10 14:32:35 +02:00
duffyduck	0773d9496d	fix(audio): AudioTrack auf USAGE_MEDIA — USAGE_ASSISTANT stallt auf OnePlus A12 Letzter Test zeigte: 163456B im Buffer mit play()-nach-Padding stallt (pos=0), aber 170048B im Pre-Roll-Pfad startet einwandfrei. Differenz nur 4% Daten — kein Buffer-Threshold-Problem, sondern AudioTrack-Quirk mit USAGE_ASSISTANT bei "voller Buffer, dann play()". USAGE_MEDIA ist robuster, AudioFocus laeuft eh separat ueber das AudioFocusModule. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 14:31:23 +02:00
duffyduck	1a4857ed62	release: bump version to 0.0.9.0	2026-05-10 14:26:41 +02:00
duffyduck	962d814318	fix(audio): kurze TTS — Padding auf 3s erhoeht (OnePlus A12 Hard-Threshold) Test mit 96000B (2s) Padding zeigte: AudioTrack stallt immer noch mit pos=0/48000. Ab 8 Worten (~2.5s) geht's — der Hard-Threshold liegt also zwischen 2s und 3s. Padding auf 3s, Buffer auf 4s. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 14:25:43 +02:00
duffyduck	9276a92c83	release: bump version to 0.0.8.9	2026-05-10 14:20:43 +02:00
duffyduck	d16896c4b4	fix(audio): kurze TTS-Texte — play() erst NACH Buffer-Fuellung mit Padding Auf OnePlus A12 startet AudioTrack nicht zuverlaessig wenn play() bei duennem Buffer gerufen wird (pos blieb 0/34112 trotz 71KB Daten + Retry). Neue Reihenfolge bei kurzem Stream: 1. Daten in Buffer schreiben (mainLoop) 2. Trailing-Silence (0.3s) 3. Padding bis min. 2s gepuffert 4. DANN erst play() Buffer auf 3s erhoeht damit blockingem write() noch Headroom bleibt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 14:19:45 +02:00
duffyduck	20050d4077	release: bump version to 0.0.8.8	2026-05-10 14:12:59 +02:00
duffyduck	79760d1b2e	fix(audio): kurze TTS-Texte spielen wieder ab — AudioTrack-Buffer entkoppelt von Preroll OnePlus A12 stallte bei kurzem Text mit pos=0/34112: 336KB Buffer fuer 3.5s Preroll, aber nur 68KB Daten drin → AudioTrack faehrt nicht an. Fix: Buffer fest auf ~2s, plus play()-Retry bei pos=0 nach 500ms. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 14:11:53 +02:00
duffyduck	13f1103604	release: bump version to 0.0.8.7	2026-05-10 14:00:29 +02:00
duffyduck	17f3d8870e	release: bump version to 0.0.8.6	2026-05-10 12:50:35 +02:00
duffyduck	33185de42b	fix(audio): AudioFocus erst beim NATIVEN Playback-Finished-Event released Logcat-Befund: 12:22:54.860 — final-Chunk + Cache geschrieben 12:22:55.402 — abandonAudioFocus (~0.5s spaeter) 12:22:55 — Spotify resumed (Atlas: TotalTime 93s) 12:23:27.064 — Playback fertig (32s spaeter!) → ARIA spricht 32s parallel zu Spotify weil end() viel zu frueh returnt. Stefans 'Spotify resumed obwohl ARIA noch redet'. Fix: - PcmStreamPlayerModule emittiert 'PcmPlaybackFinished' RN-Event nach dem finally{}-Block im Writer-Thread (= AudioTrack hat alle Samples wirklich durchgespielt) - audioService subscribed im constructor → ruft erst dann _releaseFocusDeferred() - _handlePcmChunkImpl bei isFinal triggert NICHT mehr direkt das Release — nur die playbackFinished-Listener (UI-Logic) So bleibt Spotify pausiert bis ARIA tatsaechlich fertig ist, egal wie viel Audio im AudioTrack-Buffer wartet. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 12:29:55 +02:00
duffyduck	1a982c0d45	release: bump version to 0.0.8.5	2026-05-10 12:01:46 +02:00
duffyduck	7f7db100af	release: bump version to 0.0.8.4	2026-05-10 11:53:48 +02:00
duffyduck	bef59ba134	release: bump version to 0.0.8.3	2026-05-10 11:46:26 +02:00
duffyduck	dbebfd44ff	fix(tts): Idle-Cutoff im PCM-Writer von 30s auf 120s Bug-Vermutung: lange F5-TTS-Antworten reissen ab wenn die Gamebox zwischen Saetzen >30s braucht (Modell-Wechsel, kalte GPU, ungewoehnlich schwerer Satz). Writer-Thread brach dann mit 'Idle-Cutoff' ab und ARIA verstummte mitten im Text. 120s deckt auch lange GPU-Pausen ab. Bei echtem Bridge-Crash brauchen wir trotzdem irgendwann einen Cutoff damit der Foreground-Service nicht ewig haengt. Stefan kann ADB-Logs gerade nicht ziehen (telefoniert) — bei Bug 3 (Spotify) muessen wir noch die Native-Logs sehen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 10:37:59 +02:00
duffyduck	4d0b9e0d78	fix: dB-Range -85, Mute haert auch laufende TTS, VoIP-Anrufe + Bild-Bubble Bug 1 — dB-Range erweitert: VAD_SILENCE_DB_MIN von -55 auf -85 dB. Damit hat Stefan einen weiten Regler-Spielraum wenn die adaptive Auto-Erkennung in seiner Umgebung nicht zuverlaessig greift. Bug 5 — Mute-Button stoppt laufende TTS nicht: audioService bekommt jetzt einen internen _muted-Flag. handlePcmChunk setzt silent automatisch wenn _muted true ist, playAudio kehrt frueh zurueck. Verhindert Race zwischen User-Klick auf Mute und einem TTS-Chunk der im selben JS-Tick ankommt (vorher: Ref-Update via useEffect erst nach dem Re-Render → Chunks "rutschten durch"). Plus ttsCanPlayRef wird im toggleMute-Handler synchron aktualisiert. Bug 4 — VoIP/Messenger-Anrufe erkennen: AudioFocusModule emittiert jetzt "AudioFocusChanged" Events mit type "loss"/"loss_transient"/"gain". WhatsApp/Signal/Discord/etc. requestn AudioFocus_GAIN_TRANSIENT_EXCLUSIVE wenn ein Anruf reinkommt — wir fangen das in phoneCall.ts ab und rufen halt + pauseForCall genau wie beim klassischen Anruf. Plus getMode() Polling-Fallback (alle 3s) weil GAIN nicht zuverlaessig kommt wenn wir den Focus selbst released haben — sobald AudioMode wieder NORMAL ist, resumeFromCall. Bug 6 — Bilder als "Strich": attachmentImage hatte width: '100%' in einer Bubble mit maxWidth: '80%' ohne explizite Parent-Breite → RN rendert auf 0px Breite. Neue ChatImage- Komponente nutzt Image.getSize um die echte aspectRatio zu messen + setzt sie dynamisch. Bubble passt sich dem Bild an. Bugs 2 (lange Texte mid-cutoff) + 3 (Spotify resumed) — brauchen ADB-Logs. ADB-WLAN ueber 192.168.177.22:5555 schlaegt fehl (refused) — bei Android 11+ braucht's Wireless-Debugging-Pairing-Code. Stefan kann den nennen sobald er soweit ist. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 10:28:52 +02:00
duffyduck	0c43a18402	release: bump version to 0.0.8.2	2026-05-07 08:31:06 +02:00
duffyduck	2eb0b4df90	release: bump version to 0.0.8.1	2026-05-06 23:49:36 +02:00
duffyduck	d6b54d3247	feat(audio): Background-Service auch fuer Wake-Word + Aufnahme + Doku-Split Erweitert den Foreground-Service um den microphone-Type damit nicht nur TTS, sondern auch Wake-Word-Lauschen und aktive Aufnahmen weiterlaufen wenn die App im Hintergrund ist. Slot-System (backgroundAudio.ts): - 'tts' : ARIA spricht - 'rec' : Aufnahme laeuft - 'wake' : Wake-Word lauscht passiv (Ohr aktiv) Mehrere Slots koennen unabhaengig acquired/released werden, der Service laeuft solange mindestens einer aktiv ist. Notification-Text passt sich dynamisch an den hoechstprioren Slot an (tts > rec > wake). Wiring (ChatScreen): - onPlaybackStarted/Finished → 'tts' Slot - audioService.onStateChange (recording) → 'rec' Slot - wakeWordService.onStateChange (off→armed/conversing) → 'wake' Slot AndroidManifest: - foregroundServiceType="mediaPlayback\|microphone" (Pflicht ab Android 14 fuer Background-Mic-Zugriff) - FOREGROUND_SERVICE_MICROPHONE Permission Doku: - issue.md Erledigt-Sektion in "Bugs / Fixes", "App Features" und "Infrastruktur" gesplittet - README: Background-Service-Beschreibung erweitert Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 23:43:24 +02:00
duffyduck	ead28cf09a	feat(audio): Foreground-Service haelt TTS am Leben bei minimierter App ARIAs Antwort wird jetzt auch dann fertig vorgelesen wenn der User die App im Hintergrund schickt. Vorher hat Android den Prozess kurz nach dem Minimieren eingefroren — TTS verstummte mitten im Satz. Native: - AriaPlaybackService.kt: Service mit foregroundServiceType=mediaPlayback, zeigt persistente Notification "ARIA spricht — antippen oeffnet die App" (channel low-priority, ongoing, tap → MainActivity) - BackgroundAudioModule.kt: RN-Bridge mit start()/stop() - AndroidManifest: FOREGROUND_SERVICE + FOREGROUND_SERVICE_MEDIA_PLAYBACK + POST_NOTIFICATIONS Permissions, Service deklariert JS: - backgroundAudio.ts: idempotenter Wrapper (active-Flag verhindert doppelte start/stop calls) - ChatScreen onPlaybackStarted → startBackgroundAudio - ChatScreen onPlaybackFinished → stopBackgroundAudio - audio.ts stopPlayback ruft auch stopBackgroundAudio damit die Notification bei Cancel/Barge-In/Anruf nicht haengen bleibt Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 23:37:46 +02:00
duffyduck	a648dad96d	release: bump version to 0.0.8.0	2026-05-06 23:06:22 +02:00
duffyduck	4ba48940b9	release: bump version to 0.0.7.9	2026-05-06 23:00:32 +02:00
duffyduck	7682a0ce58	release: bump version to 0.0.7.8	2026-05-06 22:58:20 +02:00
duffyduck	55ef207454	release: bump version to 0.0.7.7	2026-05-06 22:52:23 +02:00
duffyduck	6651f5937d	feat(audio): Wake-Word parallel zu TTS mit AcousticEchoCanceler Du kannst jetzt "Computer" sagen waehrend ARIA noch redet — TTS verstummt, neue Aufnahme startet. Vorher musste man warten oder manuell den Voice-Button tappen. Native (OpenWakeWordModule.kt): - AudioRecord-Source von MIC auf VOICE_COMMUNICATION (aktiviert auf den meisten Geraeten Echo-Cancellation + Noise-Suppression) - Zusaetzlich AcousticEchoCanceler/NoiseSuppressor/AutomaticGainControl explizit aktiviert wenn vorhanden — robuster auf Geraeten wo die VOICE_COMMUNICATION-Source die Effects nicht automatisch mitbringt - releaseAudioEffects() im stop/dispose JS (wakeword.ts): - Neue API: startBargeListening / stopBargeListening — Wake-Word parallel aktivieren, ohne den State 'conversing' zu verlassen - onWakeDetected unterscheidet jetzt: in 'conversing' → barge-in- Callback (nicht der normale wake-callback). Sonst Standard-Pfad. - onBargeIn-Subscriber-API + isBargeListening-Getter Lifecycle-Wiring (audio.ts + ChatScreen): - audioService.onPlaybackStarted callback (neu) - ChatScreen: Bei TTS-Start → wakeWord.startBargeListening - ChatScreen: Bei TTS-Ende → wakeWord.stopBargeListening (sonst kein AudioRecord fuer die naechste Aufnahme) - ChatScreen: Bei BargeIn → haltAllPlayback + cancel_request + 150ms-Pause + neue Aufnahme starten issue.md + README aktualisiert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 22:50:09 +02:00
duffyduck	ec9530f17f	release: bump version to 0.0.7.6	2026-05-06 22:41:55 +02:00
duffyduck	97cb7be313	feat(audio): "Bereit"-Sound (Ding-Dong) wenn Mikro nach Wake-Word offen ist Kurzer akustischer Hinweis (Airplane Ding-Dong, 20KB MP3) bei audioService.startRecording-Erfolg im Wake-Word-Pfad — User weiss exakt ab wann er reden darf, statt das Toast nur zu sehen. Quelldatei: android/sounds/Airplane-ding-dong.mp2 → ffmpeg-konvertiert zu MP3 64kbps, abgelegt in android/app/src/main/res/raw/ damit Android sie als Resource laden kann. Toggle in App-Settings → Wake-Word, default aktiv. Bei Aktivierung spielt direkt eine Vorschau ab damit man weiss wie's klingt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 22:40:45 +02:00
duffyduck	a9a87f12df	release: bump version to 0.0.7.5	2026-05-06 22:15:49 +02:00
duffyduck	fa0667088a	release: bump version to 0.0.7.4	2026-05-06 20:30:37 +02:00
duffyduck	6c7fd1d0e3	release: bump version to 0.0.7.3	2026-05-06 20:12:01 +02:00
duffyduck	9d8db111ac	release: bump version to 0.0.7.2	2026-05-05 14:51:18 +02:00
duffyduck	b1ccf29295	release: bump version to 0.0.7.1	2026-05-03 22:11:08 +02:00

1 2 3 4

192 Commits