release: bump version to 0.0.8.5

docs: Audio-Verhaltens-Tabelle in issue.md + README
Definiert klar wann Spotify pausiert und wann nicht — als Referenz fuer kuenftige Bug-Reports. Aktueller Zustand nach den Audio-Fixes: Spotify pausiert nur waehrend User-Aufnahme + TTS-Wiedergabe, nicht waehrend ARIAs Denkphase. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-10 12:01:46 +02:00 · 2026-05-10 12:00:41 +02:00 · 2026-05-10 11:59:13 +02:00 · 2026-05-10 11:53:48 +02:00 · 2026-05-10 11:52:07 +02:00
5 changed files with 59 additions and 4 deletions
@@ -510,10 +510,30 @@ Der Update-Flow:
 App (Mikrofon) → AAC/MP4 Aufnahme → Base64 → RVS → Bridge
 Bridge: FFmpeg (16kHz PCM) → Whisper STT → Text → aria-core
 Bridge: STT-Ergebnis → RVS → App (Placeholder wird durch transkribierten Text ersetzt)
-aria-core → Antwort → Bridge → XTTS (Gaming-PC) → PCM-Stream → RVS → App
+aria-core → Antwort → Bridge → F5-TTS (Gaming-PC) → PCM-Stream → RVS → App
 App: AudioTrack MODE_STREAM (nahtlos), Cache als WAV pro Message
 ```
 ### Audio-Verhalten in der App
 | Phase                        | Andere App (Spotify) | ARIA-Mikro              |
 |------------------------------|----------------------|-------------------------|
 | Idle / Ohr aus               | spielt frei          | aus                     |
 | Wake-Word lauscht (armed)    | spielt frei          | passiv (openWakeWord)   |
 | User-Aufnahme laeuft         | pausiert (EXCLUSIVE) | Recording               |
 | Aufnahme zu Ende             | resumed              | aus                     |
 | ARIA denkt/schreibt (~20s)   | spielt frei          | aus                     |
 | TTS startet                  | pausiert (DUCK)      | aus (oder barge)        |
 | TTS spielt (auch GPU-Pausen) | bleibt pausiert      | barge wenn Wake-Word    |
 | TTS zu Ende                  | nach 800ms resumed   | (Conversation-Window)   |
 | Eingehender Anruf (auch VoIP)| —                    | Mikro pausiert          |
 | Anruf vorbei                 | —                    | Mikro wieder armed      |
 Mechanismen: Underrun-Schutz im PcmStreamPlayer (Stille-Fill in Render-
 Pausen), Conversation-Focus bei Wake-Word, Foreground-Service mit
 mediaPlayback|microphone, Anruf-Erkennung ueber TelephonyManager +
 AudioFocus-Loss-Listener mit Polling-Fallback (VoIP).
 ### Datei-Pipeline (Bilder & Anhaenge)
 ```
@@ -79,8 +79,8 @@ android {
        applicationId "com.ariacockpit"
        minSdkVersion rootProject.ext.minSdkVersion
        targetSdkVersion rootProject.ext.targetSdkVersion
-        versionCode 803
+        versionCode 805
-        versionName "0.0.8.3"
+        versionName "0.0.8.5"
        // Fallback fuer Libraries mit Product Flavors
        missingDimensionStrategy 'react-native-camera', 'general'
    }
@@ -1,6 +1,6 @@
 {
  "name": "aria-cockpit",
-  "version": "0.0.8.3",
+  "version": "0.0.8.5",
  "private": true,
  "scripts": {
    "android": "react-native run-android",
@@ -495,6 +495,8 @@ const ChatScreen: React.FC = () => {
        const activity = (message.payload.activity as string) || 'idle';
        const tool = (message.payload.tool as string) || '';
        setAgentActivity({ activity, tool });
        // Spotify darf waehrend "ARIA denkt/schreibt" weiterspielen — pausiert
        // nur wenn TTS startet (dann acquired _firePlaybackStarted den Focus).
      }
      // Voice-Config aus Diagnostic — setzt die lokale App-Stimme auf den
@@ -1,5 +1,38 @@
 # ARIA Issues & Features
 ## Audio-Verhalten in der App
 So sollte die App in den verschiedenen Phasen mit fremden Audio-Apps
 (Spotify, YouTube, Podcasts etc.) und dem eigenen Mikro umgehen.
 Wenn was anders ist, ist's ein Bug.
 | Phase                        | Andere App (Spotify) | ARIA-Mikro          | Hintergrund-Service |
 |------------------------------|----------------------|---------------------|---------------------|
 | Idle / Ohr aus               | spielt frei          | aus                 | aus                 |
 | Wake-Word lauscht (armed)    | spielt frei          | passiv (openWakeWord) | aktiv ('wake')    |
 | User-Aufnahme laeuft         | pausiert (EXCLUSIVE) | Recording           | aktiv ('rec')       |
 | Aufnahme zu Ende             | resumed              | aus                 | (rec released)      |
 | ARIA denkt/schreibt (~20s)   | spielt frei          | aus                 | (kein Slot)         |
 | TTS startet                  | pausiert (DUCK)      | aus (oder barge)    | aktiv ('tts')       |
 | TTS spielt (auch GPU-Pausen) | bleibt pausiert      | barge wenn Wake-Word| aktiv               |
 | TTS zu Ende                  | nach 800ms resumed   | (Conversation-Window)| (tts released)     |
 | Eingehender Anruf (auch VoIP)| —                    | Mikro pausiert      | aus                 |
 | Anruf vorbei                 | —                    | Mikro wieder armed  | aktiv ('wake')      |
 Wichtige Mechanismen:
 - **Underrun-Schutz** im PcmStreamPlayer fuettert Stille rein wenn die
  Bridge in Render-Pausen liefert — Spotify bleibt durchgehend pausiert,
  auch zwischen den Saetzen einer langen Antwort.
 - **Conversation-Focus** (nur bei Wake-Word 'conversing') haelt den
  AudioFocus dauerhaft. Bei reinem Tap-to-Talk oder Text-Chat greift's
  nicht — Spotify darf in der Denk-Phase ruhig weiterspielen.
 - **Foreground-Service** (mediaPlayback|microphone) haelt App-Prozess
  am Leben damit TTS/Mikro/Wake-Word auch bei minimierter App weiter-
  laufen. Notification zeigt aktuellen Status ("ARIA spricht/hoert
  zu/bereit").
 - **Anruf-Erkennung** ueber TelephonyManager (klassisch) + AudioFocus-
  Loss-Listener mit Polling-Fallback (VoIP wie WhatsApp/Signal/Discord).
 ## Erledigt
 ### Bugs / Fixes
Author	SHA1	Message	Date
duffyduck	1a982c0d45	release: bump version to 0.0.8.5	2026-05-10 12:01:46 +02:00
duffyduck	dfba5ceb1f	docs: Audio-Verhaltens-Tabelle in issue.md + README Definiert klar wann Spotify pausiert und wann nicht — als Referenz fuer kuenftige Bug-Reports. Aktueller Zustand nach den Audio-Fixes: Spotify pausiert nur waehrend User-Aufnahme + TTS-Wiedergabe, nicht waehrend ARIAs Denkphase. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 12:00:41 +02:00
duffyduck	1a6f633836	fix(audio): rollback agentActivity-Conversation-Focus, Spotify pausiert NUR bei TTS Der vorige Commit (acquireConversationFocus bei agentActivity != idle) war zu aggressiv — Spotify pausierte schon waehrend 'ARIA denkt/schreibt' und das zugehoerige release greift nicht zuverlaessig (Race mit nachfolgenden agent_activity-Events). Stefan: 'spotify resumet nicht mehr, hoert schon beim ARIA-denkt-Passus auf zu spielen'. Erwartetes Verhalten: - Aufnahme: AudioFocus → Spotify pausiert (~5s) - ARIA denkt/schreibt (~20s): kein Focus → Spotify spielt weiter - TTS: AudioFocus per requestDuck → Spotify pausiert - TTS-Ende: deferred release nach 800ms → Spotify resumed Underrun-Schutz im PcmStreamPlayer haelt Spotify durchgehend gepaust solange TTS rendert (auch in den GPU-Pausen zwischen Saetzen). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 11:59:13 +02:00
duffyduck	7f7db100af	release: bump version to 0.0.8.4	2026-05-10 11:53:48 +02:00
duffyduck	d646e9d58e	fix(audio): Spotify spielt nicht mehr in der ARIA-Verarbeitungspause Logcat-Befund: zwischen User-Aufnahme-Ende und TTS-Start liegt eine ~20s-Pause (Whisper STT + Claude + F5-TTS). In dieser Zeit hatte ARIA keinen AudioFocus → Spotify lief munter weiter, dann pausierte beim TTS-Start. Stefan hoerte das als 'Spotify kommt nach 20s wieder'. Fix: ChatScreen ruft acquireConversationFocus sobald ein agent_activity- Event mit activity != 'idle' kommt. Solange ARIA arbeitet (thinking/ tool/responding) bleibt der Focus gehalten, Spotify bleibt pausiert. Bei onPlaybackFinished oder cancelRequest wird releaseConversationFocus gerufen — sonst bliebe Spotify ewig stumm. Funktioniert auch fuer reine Text-Chats (kein Wake-Word noetig). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 11:52:07 +02:00