ARIA-AGENT

Author	SHA1	Message	Date
duffyduck	7d16a0f3e5	fix(brain): 17. seed_rule — ARG_<NAME> ENV-Konvention NIEMALS aendern Beobachtung 30.05.2026: ARIA hat beim skill_update des spotify-Skills die ARG_-Konvention verloren. Statt os.environ.get('ARG_PATH', '') hat sie os.environ.get('PATH', '') geschrieben. PATH ist aber die reservierte Linux-Environment-Variable fuer den Executable-Suchpfad (/usr/local/sbin:/usr/local/bin:...). Folge: Skill las den System-PATH als URL-Pfad, rief https://api.spotify.com/usr/local/sbin:/usr/local/bin:... → 404 zurueck. Stefan dachte Spotify sei kaputt. Rollback noetig (Auto-Archive hat geholfen — alte Version war gluecklicherweise noch da). Neue Regel macht das explizit: - ARG_<UPPER_NAME> ENV ist Pflicht-Konvention vom Skill-Runner - Liste reservierter ENV-Namen die NICHT genommen werden duerfen: PATH, HOME, USER, SHELL, LANG, TERM, PWD, OLDPWD, BRAIN_INTERNAL_URL, SKILL_DIR, SHARED_UPLOADS, CFG_* - Mit Praefix ARG_ keine Kollision moeglich Plus skill_create Tool-Description um den gleichen Hinweis ergaenzt: 'Args lesen via os.environ['ARG_<UPPER_NAME>'] — der Praefix ARG_ ist Pflicht. NIEMALS direkt PATH/METHOD/BODY etc. abrufen — das sind reservierte System-ENV (PATH = Executable- Suchpfad, nicht Dein arg!).' Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 02:17:01 +02:00
duffyduck	0a859f637b	fix(brain): 16. seed_rule — Skills sind erweiterbar, nicht heilig Beobachtung 30.05.2026: Stefan bittet ARIA via skill_update den spotify-Skill so anzupassen dass currently-playing strukturiert ausgegeben wird (Track/Artist/Album/Device/Zeit). ARIA antwortet mit Defensiv-Reflex: 'Der Skill ist nur ein OAuth2-Wrapper, ich kann das nicht im Wrapper bauen — ich schlage einen zweiten Skill spotify_now_playing vor'. Quatsch. Skills sind beliebiger Python-Code. Ein `if path.endswith('currently-playing'): pretty_output()` waere trivial im Skill drin gewesen. Stefan haette das nicht selbst erkennen muessen — genau dafuer ist ARIA da. Neue Regel macht das explizit: - skill_get + skill_update ist der Standard-Workflow fuer Skill-Anpassungen - Skills duerfen if-Verzweigungen, json-Parsing, Output-Filterung, mehrere Endpoints in einem Skill etc. - 'Kann ich nicht in den Wrapper bauen' ist Antipattern - 'Ich schlage einen zweiten Skill vor' ohne erst skill_update zu pruefen ist Antipattern - Stefan ist KEIN Python-Entwickler — er nennt das ZIEL, ARIA baut das WIE. Plus skill_update Tool-Description um den gleichen Gedanken ergaenzt: 'Skills sind ganz normaler Python-Code, du kannst sie beliebig erweitern.' Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 02:09:37 +02:00
duffyduck	8c1476c2ca	fix(brain): 15. seed_rule — Brain-Tools per XML-Tag, nicht als native Tool-Use Beobachtung beim Hook-Deploy-Test (30.05.2026, 01:51-52): ARIA versucht run_spotify zuerst als nativen Tool-Use → 'No such tool available' weil claude-CLI nur seine eigenen Tools (Bash/Read/Write/etc.) kennt; Brain-Tools sind als Prompt-Instruction injiziert. Erst nach dem 'No such tool'-Fehler wechselt ARIA aufs XML-Tag-Format <tool_call name="...">{...}</tool_call>, das der proxy parsed und ans Brain weiterleitet. Dieser Lernzyklus pro Anfrage kostet ~30s. Die Regel erklaert die Architektur (claude-CLI vs Proxy vs Brain) und gibt das richtige Format vor — direkt XML-Tag, nicht native Tool-Use. Beilaeufige Bestaetigung an Stefan: seed_rules.py ist System-Code, wird bei jedem Brain-Lifespan-Start aufgespielt — frische DB nach Wipe wird beim ersten Boot mit den 15 Regeln gesetzt, idempotent ueber migration_key. Im Gegensatz zu brain-import/ (gitignored, manuelle Migration via Diagnostic-Klick). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 01:56:53 +02:00
duffyduck	7d8c411f5c	feat(proxy): PreToolUse-Hook blockiert Bash-curl wenn Skill existiert Variante A endlich umgesetzt: echter Hard-Block vor Bash-Ausfuehrung. Anders als 14 seed_rules + Bypass-Lehre, die ARIA ignorieren kann, ist das ein technisch erzwungener Reject auf claude-CLI-Ebene. Komponenten: 1. aria-brain main.py: neuer Endpoint POST /skills/can-bash-host Bekommt {command}, parst https-URLs raus, prueft gegen aktive Skills (stem-match: 'spotify' im Hostname 'api.spotify.com'). Returnt {block, host, skill, safe_tool} wenn ein Skill den Host abdeckt. 2. proxy-patches/pre-tool-bash-block.js: Node-Script das vom claude-CLI als PreToolUse-Hook fuer das Bash-Tool aufgerufen wird. Liest Tool- Use-Payload via stdin, ruft Brain-Endpoint mit kurzem Timeout (3s), bei block=true → exit 2 mit Stderr-Message. claude-CLI gibt Stderr als tool_use_error an das LLM zurueck — echter Fehler, nicht ignorierbar. Fail-open bei Brain-Down / Timeout / JSON-Fehler: kein Lockout. 3. proxy-patches/managed-settings.json: claude-CLI Hook-Config mit PreToolUse-Matcher 'Bash' der das Node-Script ausfuehrt. /etc/claude-code/managed-settings.json hat Vorrang vor User-Settings und betrifft NICHT Stefans Host-~/.claude/settings.json. 4. docker-compose.yml: proxy-Command erweitert um `mkdir -p /etc/claude-code && cp managed-settings.json dorthin` damit beim Container-Start die Hook-Config aktiv ist. Beobachtung die das motiviert: 14 seed_rules + Bypass-Lehre + Auto-Scaffold + Safe-Names. ARIA hat trotzdem letzten Test mit 2 verschachtelten Bash-curls bedient statt run_spotify zu rufen (content_len=73, tool_calls=0). Prompt-Engineering ausgereizt. ARIA bekommt jetzt: 🚨 BASH GEGEN api.spotify.com BLOCKIERT. Es existiert bereits ein Skill 'spotify' fuer diesen Host. ... Konkret: nutze JETZT `run_spotify` mit den passenden Parametern (method/path/body) statt curl. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 01:49:56 +02:00
duffyduck	e7fd918559	fix(brain): zwei neue seed_rules — kein Sub-Agent fuer Skills + Anti-Halluzination Live-Beobachtung am 30.05.2026: ARIA spawnte `Agent` (Sub-Agent) mit Anweisung 'Call run_spotify...' statt das Tool direkt aufzurufen. Der Sub-Agent ist eine isolierte Claude-CLI-Session ohne Brain-Tools, hat also 'No such tool: run_spotify' gemeldet. ARIA hat dann halluzinierte Track-Namen ausgegeben ('Set You Free – N-Trance', 'Tomcraft – Loneliness'), als waeren das echte Spotify-Daten. Drei distinkte Probleme, zwei neue Regeln: 13. seed/skill-rule/no-subagent-for-skills: Brain-Tools (run_, oauth_, memory_* …) NIEMALS via Agent-Subagent aufrufen — die sind isoliert und sehen die Brain-Tools nicht. Direkt in der Haupt-Session aufrufen. Subagent nur fuer Code-Search / Web-Recherche / parallele unabhaengige Aufgaben. 14. seed/rule/no-hallucinated-results (Kategorie 'ehrlichkeit'): Bei Tool-Fail / abgeschnittenem Response / fehlendem Tool: ehrlich sagen, NICHT raten. Anti-Antipattern: 'Stefan vertraut Deinen Antworten — wenn Du raetst und es als Fakt verkaufst, bricht das Vertrauen'. Mit konkreten Formulierungs-Beispielen. Beide Regeln sind erfahrungsbasiert (mit Datum + konkretem Vorfall) — ARIA sieht im Hot-Memory was sie selbst falsch gemacht hat. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 01:29:41 +02:00
duffyduck	210ce62ffe	feat(brain): Skill-Bypass-Detection + Bypass-Lehre als pinned Memory Variante 3+ (Lerneffekt-Variante): Variante C scaffolded zwar Skills auto, aber ARIA lernt nicht — sie wird beim naechsten Mal trotzdem zu Bash greifen. Stefans Punkt: Lernen geht nur ueber Brain-Memory. Mechanik: 1. api_heuristic.detect_recent_bypass(skills, since_sec=600): schaut letzte 10 Min im agent_stream.jsonl, findet Bash-curl gegen Hosts fuer die bereits ein matching Skill existiert. Returnt {host, skill_name, count, last_ts}. 2. api_heuristic.build_bypass_section(events): Drastischer Markdown-Block "## 🚨 SKILL-BYPASS ERKANNT" mit konkretem run_<skill>-Hint pro betroffenem Host. Landet direkt im System-Prompt noch VOR dem normalen API-Heuristik-Block. 3. agent.py._upsert_bypass_lesson(ev): Schreibt eine pinned type=rule Memory mit source=auto-feedback und migration_key=auto/skill-bypass/<skill_name>. Idempotent: bei Wiederholung wird die alte Memory ueberschrieben (Counter aktualisiert), keine Karteileichen. Content nennt konkret den run-Tool-Namen und Performance-Vergleich (3s Tool-Call vs 13-20s Bash-Wrapper). Diese Memory ist permanent pinned → kommt bei jedem Chat-Turn, cross-session, cross-restart als Hot-Memory durch. Damit lernt ARIA es im wortlichen Sinne, nicht nur Reibung in der aktuellen Konversation. Idempotenz wichtig: bei jedem Bypass-Detection-Lauf wird die Memory upgedatet (nicht dupliziert). Stefan kann sie via Diagnostic-Gehirn-Tab loeschen falls sie nervt. Stefan-Frage beantwortet: 'sie wuerde es aber nur lernen wenn sie es auch im gehirn speichert oder?' — exakt. Schimpfen im Prompt ist Reibung dieser Session, pinned Memory ist permanenter Lerneffekt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 00:37:40 +02:00
duffyduck	298b2202a1	feat(brain): Auto-Scaffold — Brain legt Skills selbst an wenn ARIA driftet Variante C: ARIA hat selbst mit Heuristik-Block + 11 seed_rules den expliziten skill_scaffold-Befehl ignoriert (32x Spotify-Bash-Calls in 24h, kein einziger scaffold-Aufruf). Verhaltens-Traegheit ist staerker als jeder Prompt-Hint. Loesung: Brain wartet nicht mehr. Bei jedem chat()-Aufruf wird die Heuristik berechnet. Findet sie einen Host mit bekannter Suggestion (Spotify, GitHub, OpenAI, OpenWeather, Telegram, Microsoft, Discord, Notion, Reddit) der noch keinen Skill hat → Brain ruft selbst `scaffold_skill(name, template, params)` mit author='aria-auto'. Der frische Skill ist sofort im Prompt sichtbar (Skill-Liste wird nach Scaffold refreshed, Heuristik-Cache invalidiert, Hints neu gerechnet). Side-Channel-Event 'skill_created' mit Flag 'auto_scaffolded' geht an die UI — Stefan sieht im Chat dass Brain einen Skill angelegt hat. ARIA findet beim Tool-Use-Loop einen passenden `run_<name>`-Skill vor und nutzt ihn idealerweise statt wieder Bash. Macht sie's nicht und curlt trotzdem weiter, ist der Counter beim naechsten Mal wieder hoch und Brain scaffolded weiter — aber dann ist der Skill ja schon da, also nur ein Pfad. Toggle: BRAIN_AUTO_SCAFFOLD=false zum Abschalten. scaffold-reflex Regel angepasst: ARIA wird informiert dass Brain manchmal selbst scaffolded (author=aria-auto) und sie den Skill via run_<name> nutzen soll statt zu curlen. Bei Hinweisen OHNE Suggestion (unbekannter Host) soll sie selbst skill_scaffold rufen. Stefan-Zitat aus der Diskussion ("ARIA lernt es so nicht"): stimmt inhaltlich, aber pragmatisch wichtiger ist dass Stefans Wartezeit von 20s auf 3s sinkt. Lernen kann sie spaeter — der Skill ist da, sie sieht den Pfad jedes Mal beim Tool-Listing. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 00:28:15 +02:00
duffyduck	845a8b0020	feat(brain): API-Heuristik — Cross-Session-Counter fuer Skill-Drift Variante B: scaffold-reflex Regel allein reicht nicht weil jede Chat- Anfrage eine eigene claude-CLI-Session ist. ARIA sieht in der aktuellen Session nicht dass sie gestern auch schon 10x dieselbe API gecurled hat. Beobachtung: 5+ Spotify-Bash-Calls hintereinander, kein Skill angelegt. Loesung: Brain trackt server-side aus dem persistierten agent_stream.jsonl. Bei jedem chat() wird der Log gescanned (cache 5min), Bash-curl-Calls nach Hostname aggregiert. Hosts mit >=3 Calls in 24h ohne passenden Skill landen als '## API-Heuristik'-Block im System-Prompt mit konkretem skill_scaffold-Vorschlag. Neue Module: - aria-brain/api_heuristic.py: - compute_hints(existing_skills, force): Aggregiert + filtert - build_section(hints): formatiert als kompakten Markdown-Block - Smart suggestions mapping (api.spotify.com → oauth-api template etc.) - Ignoriert interne Hosts (aria-brain, localhost, docker-bridge) - 5-min Cache damit nicht jeder Turn die JSONL parst - aria-brain/prompts.py: build_system_prompt nimmt api_heuristic_section als optionalen Block direkt nach Skills-Section. - aria-brain/agent.py: vor build_system_prompt Heuristik berechnen mit aktueller Skill-Liste, Block durchreichen. - 11. seed_rule scaffold-reflex umgeschrieben: kein 'in einer Session' mehr (das ergab keinen Sinn — jeder Turn neue Session). Stattdessen: '## API-Heuristik'-Block ist Dein Cross-Session-Gedaechtnis. Wenn da was steht: scaffolden BEVOR Du Bash machst. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 00:19:06 +02:00
duffyduck	0540c49c66	feat(brain): skill_scaffold — Templates statt Skill aus dem Nichts Variante C: niedrigere Huerde zum Skill-Bau. Statt einen kompletten Python-Skill via skill_create zu generieren (~100 Zeilen Code, teuer in Tokens und fehleranfaellig), waehlt ARIA ein Template + minimale params, Brain expandiert das Skelett in ~1s zu fertigem Skill. Beobachtung: ARIA driftet bei Spotify, PDF etc. zu Bash-curl statt einen Skill zu bauen, weil die Skill-Bau-Huerde zu hoch ist (Code, README, args, pip_packages, config_schema). Mit Templates ist die Huerde minimal. Neue Module: - aria-brain/skill_templates.py: drei mitgelieferte Templates - oauth-api: OAuth2-API (Spotify, GitHub, Reddit, Google, Discord, ...). Token via BRAIN_INTERNAL_URL/oauth/<s>/token mit Auto-Refresh. Args: method/path/body/base_url - apikey-api: API mit statischem Key (OpenWeather, OpenAI, Twilio). Key liegt im config_schema -> CFG_<NAME> ENV, KEIN hardcoden. Konfigurierbar: auth_header (Authorization\|X-Api-Key), auth_prefix. - file-process: Skelett fuer File-In/File-Out (PDF, Bild, JSON). process()-Funktion ist Stub, ARIA fuellt sie via skill_update. Templates nutzen Token-Replacement statt f-Strings (sonst Konflikt mit dem skill-internen Python-Code). - aria-brain/skills.py: scaffold_skill(name, template, params, author) wrappt create_skill mit den expandierten Feldern. - aria-brain/agent.py: neues Brain-Tool skill_scaffold mit detaillierter Description (Template-Liste + params-Schema). Dispatcher-Handler schickt skill_created Side-Channel-Event analog zu skill_create. - aria-brain/main.py: POST /skills/scaffold + GET /skills/templates (letzteres listet alle Templates fuer UI/Diagnostic). - 11. seed_rule scaffold-reflex: bei 2x derselben API per Bash-curl SOFORT skill_scaffold rufen. Belohnung explizit benannt ("welches lied" von 20s auf 3s). README mit Skills-Scaffold-Tabelle ergaenzt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 00:02:45 +02:00
duffyduck	add303970b	feat(brain): 10. seed_rule — runtime-topology (wo ARIA tatsaechlich laeuft) Beobachtung beim "ueberspringe Lied"-Test (29.05.2026): 47 Sekunden mit 12 fehlgeschlagenen Bash-Versuchen weil ARIA glaubte sie sei im aria-brain Container. Sie hat probiert: - python3/python/jq (Alpine — alle nicht installiert) - cd /data/skills/spotify-control (existiert nur im Brain) - curl localhost:8080/oauth/... (localhost = aria-proxy, nicht Brain) - 8s Timeout auf localhost (kein TCP Reset) Erst nach 9 Versuchen brain:8080 erraten und dann den Token-Wert hardcoded in den naechsten curl gepackt. Die neue Regel beschreibt die echte Topologie explizit: - Du bist die claude-CLI als Subprocess IM aria-proxy (node:22-alpine) - KEIN python3/python/jq verfuegbar - /data/skills/ existiert NUR im aria-brain - localhost in Deinem Bash heisst aria-proxy; Brain ist aria-brain:8080 - BRAIN_INTERNAL_URL ist NUR in laufenden Skills gesetzt - Brain-Resources via Brain-Tools (oauth_get_token, memory_search, run_<skill_name>), NICHT via Bash - SSH zur VM-Host: `ssh aria@host` (ed25519-Key liegt im Proxy) - Externe APIs direkt per curl mit Token aus oauth_get_token Plus das Anti-Pattern dokumentiert ("47 Sekunden Stefan-Lebenszeit") — ARIA soll bei jedem Bash-Reflex gegen "lokale" Brain-Resources erst denken oder die Brain-Tool-Ebene nehmen. README in Skills-Architektur-Sektion entsprechend ergaenzt (10 Regeln). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 23:30:50 +02:00
duffyduck	aaaf118cb7	feat: 2 neue seed_rules + Diagnostic-Persistenz fuer agent_stream + chat-backup API Befund aus chat_backup.jsonl-Analyse heute: ARIA ist 3x auf oauth_authorize gefallen statt oauth_get_token (Stefan musste manuell einloggen), und beim PDF-Skill ist sie nach Stefans "Variante bitte" zu Ad-hoc-Bash-Befehlen auf der VM gedriftet ("ich lass den Code direkt laufen") — Skill wurde unbrauchbar. Beides genau die Antipattern die wir mit den seed_rules abdecken wollten, nur waren die zu schwach formuliert. seed_rules (jetzt 9 statt 7): - oauth-reauth-reflex: bei 401 ZUERST oauth_get_token, NUR bei dessen Fehler oauth_authorize. Stefan zu Re-Login schicken ist das aergerlichste Antipattern (er sitzt im Auto, muss Handy rauskramen). - no-skill-drift: kaputter Skill -> skill_logs + skill_update, NIEMALS zu Ad-hoc-Bash wechseln (Skill wird Karteileiche). Plus: "ich baue dir einen Skill" SAGEN ohne skill_create zu rufen ist verboten — Stefan checkt die Liste und verliert das Vertrauen. agent_stream-Persistenz: - diagnostic/server.js schreibt jeden agent_stream-Event parallel zum Broadcast in /shared/logs/agent_stream.jsonl (soft-cap 50 MB mit half-truncate beim Ueberlauf). - Live-View laedt beim Page-Load + Sub-Tab-Switch die letzten 200 Eintraege via /api/agent-stream. Browser-Reload / Standby verliert damit den Verlauf nicht mehr. Debug-API ohne SSH: - GET /api/chat-backup?lines=N (Default 200, Max 5000) — geparstes JSON der letzten N Zeilen aus chat_backup.jsonl - GET /api/agent-stream?lines=N — gleiches fuer den persistierten Stream README: - Neuer Abschnitt "## Skills — Architektur" mit Skill-Layout, Drei-Stufen-Daten-Modell (OAuth / config_schema / Brain-Daten), Versionierung, Anti-Friedhof, seed_rules (alle 9 aufgelistet). - Diagnostic-Sektion um agent_stream-Persistenz + neue Debug-Endpoints ergaenzt. - Roadmap: Phase B "Skill-Architektur P0-P4" abgehakt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 23:06:56 +02:00
duffyduck	80d2fe3e93	docs: README aktualisiert — FLUX, ARIA Live, OAuth + Caddy, Skill-Mgmt, Bridge-Watchdog, Bubble-Aktionen - Diagnostic-Sektion: OAuth-Apps zeigt jetzt Spotify-Default + on-demand- Provider statt fixe 5er-Liste, `oauth_register_provider` als 4. Tool erwaehnt, Caddy/Let's-Encrypt vor RVS dokumentiert - App-Features: Long-Press/⎘-Bubble-Aktionen + System-Share, neue Settings- Sektionen "🛠️ Skills" und "🔑 OAuth-Apps", Voice-Speed persistent - Voice-Bridge-Sektion: 3-Schichten Hang-Schutz (TCP-Keepalive + Asyncio-Watchdog + File-Based Liveness) erlaeutert, TLS-Fallback-Reset - Roadmap Phase B: sechs neue Eintraege fuer die letzten ~10 Commits (FLUX, ARIA Live + Not-Aus, OAuth-Pipeline, Skill-Mgmt-Tools, Bridge-Hang-Schutz, Bubble-Aktionen) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-24 20:55:28 +02:00
duffyduck	d939fc4ac3	feat(rvs): Caddy als TLS-Terminator + Let's Encrypt vor RVS OAuth-Provider (Spotify, Dropbox, ...) verlangen HTTPS fuer non-localhost Redirect-URIs. Bisher lief der RVS direkt auf einem TCP-Port ohne TLS — Spotify hat den Callback abgewiesen. Loesung: Caddy im selben Compose-Stack davor. Holt automatisch ein Let's Encrypt-Zertifikat fuer PUBLIC_URL (HTTP-01 ueber Port 80), terminiert TLS auf 443 und routet alles inkl. WebSocket-Upgrades an den internen RVS-Container (Port 3000). - rvs/docker-compose.yml: caddy-Service hinzu (image caddy:latest, command 'caddy reverse-proxy --from ${PUBLIC_URL} --to rvs:3000'), rvs-Service verliert ports-Block (nur intern via aria-rvs-net), data-Volumes fuer Caddy-ACME-State (persistent, Rate-Limit-Schutz). - rvs/.env.example neu: dokumentiert PUBLIC_URL + DNS/Port- Voraussetzungen. - rvs/.gitignore neu: .env + data/ (sonst landen die Zertifikate versehentlich im Repo). - README RVS-Sektion: Setup-Schritte mit Caddy + Hinweis wie man's auskommentiert wenn ein eigener Reverse-Proxy davor steht. Wer schon einen TLS-Terminator hat (nginx/Traefik): caddy-Service in der Compose auskommentieren, rvs wieder einen ports-Block geben. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-24 20:23:28 +02:00
duffyduck	acaa9fc3f2	feat(oauth): generische OAuth2-Pipeline ueber RVS-Callback (Spotify/Google/GitHub/Strava/MS) Bisher musste Stefan bei OAuth-Flows manuell den Auth-Code aus der Browser-URL kopieren (redirect_uri war localhost). Jetzt: RVS hat einen HTTP-Listener auf demselben Port wie der WebSocket, Provider redirecten nach Auth zu https://{RVS_HOST}/oauth/callback/{service}, RVS broadcastet, aria-bridge forwarded, Brain matched state + tauscht code gegen Token. Token-Refresh laeuft automatisch. - rvs/server.js: hybrid http.createServer + WebSocketServer{noServer}. Route GET /oauth/callback/{service}, broadcast oauth_callback an alle Raeume, schoene Dark-Mode-HTML-Antwort an den Browser (Auto-Close 4s). - bridge/aria_bridge.py: empfaengt oauth_callback, POSTet an Brain /internal/oauth-callback. - aria-brain/oauth.py: neuer Manager. Pending-Store mit state+TTL, Token-Exchange (Basic-Auth oder Body je nach Provider), persistente Speicherung in /shared/config/oauth_tokens.json (mode 0600), Token-Refresh wenn <60s Restzeit. Vordefinierte Configs fuer Spotify, Google, GitHub, Strava, Microsoft. - aria-brain/agent.py: META-Tools oauth_authorize / oauth_get_token / oauth_revoke. - aria-brain/prompts.py: System-Prompt-Block zeigt ARIA die feste Callback-URL als Quelle der Wahrheit + aktuelle Service-States. - aria-brain/main.py: HTTP-Endpoints /oauth/services, /oauth/apps, /oauth/authorize, /oauth/{service}/revoke, /internal/oauth-callback. - diagnostic: neue Section "OAuth-Apps". Pro Service Karte mit Status, client_id + client_secret (Passwort-Toggle), Speichern + Autorisieren- Buttons. Authorize oeffnet Provider-Auth in neuem Tab. - docker-compose.yml: brain-env um RVS_HOST + RVS_PORT_PUBLIC + RVS_TLS ergaenzt (Brain braucht die Werte zum Bau der Callback-URL). - .env.example: RVS_PORT_PUBLIC + Brain-Timeout-Vars (PROXY_TIMEOUT_SEC + Connect/Write/Pool) dokumentiert. - README.md: OAuth-Pipeline + ARIA-Live-Mirror in Diagnostic-Section, OAuth-Apps in Einstellungen-Tab erwaehnt. - issue.md: OAuth-Pipeline + Brain-Timeout-Fix als erledigt dokumentiert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-23 15:39:54 +02:00
duffyduck	b4923bc221	docs: Such-Praezision, Such-Reihenfolge, GPS-Heartbeat, About-Escape issue.md — zwei neue Blocks: 'Such-Sprung-Praezision + Such-Reihenfolge': - Cold-Start-Sprung (itemHeights-Cache via onLayout, initialNumToRender hoch) - Such-Scroll-Endlos-Loop (MAX_SCROLL_RETRIES + setMessages-no-op-skip) - searchMatchIds aus chatVisibleMessages (kein Treffer in Spezial-Bubbles) - Reihenfolge neueste zuerst (WhatsApp-analog) 'Misc App-Polish': - About-Text '—' literal → {'—'} expression block - GPS-Heartbeat 60 s gegen stationaere-User-Veraltung der Position README: - Chat-Such-Zeile um Reihenfolge + onLayout-Cache ergaenzt - GPS-Tracking-Zeile um Heartbeat ergaenzt Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-15 22:35:38 +02:00
duffyduck	b2ac013765	docs: heutige Brain-/Chat-Fixes + Gedanken-Stream issue.md — drei neue Eintraege im Chat-Stabilitaet-Block: - chat_backup ts auf UNIX-ms umgestellt + Migration - User-Bubble ⏳→failed durch agent_activity-impliziten ACK gefixt - Gedanken-Stream Modal scrollte nicht — Touchable→View+responder Neuer Block 'Brain-Hang: Multi-Tool-Timeouts + RVS-Block + Skill- Aggressivitaet' mit den drei Brain-Hang-Fixes. Neuer Block 'Gedanken-Stream + Live-Tool-Events'. README.md: - Feature-Liste der App ergaenzt um Gedanken-Stream - Diagnostic Main-Tab ergaenzt um 💭 Gedanken-Stream Modal - Proxy-Sektion: dritter sed-Patch (DEFAULT_TIMEOUT 5→20 Min) + routes.js-Patch (tool_use-Hook) dokumentiert - Brain↔Bridge ist async-Hinweis (send_to_core als create_task) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-15 11:51:57 +02:00
duffyduck	8f88cb0030	fix(chat): Doppel-Bubble nach Retry + verwaiste ACK-Timer + docs Race nach Etappe-3-Reconnect-Fix: lokale failed-Bubble (mit clientMsgId) und Server-Backup-Eintrag (ohne clientMsgId, aus alter Bridge-Version) landeten beide im Merge → User sah Doppelpost: einmal ueber der ARIA-Antwort (Server), einmal mit Retry-Knopf darunter (lokal). Plus ACK-Timer konnte weiterlaufen obwohl die Bubble schon delivered war — Retry pushte den Status zurueck auf sending und nach 30 s auf failed. App: - chat_history_response-Merge faellt zusaetzlich auf text+timestamp- Heuristik im 5-Min-Fenster zurueck wenn die Server-Bubble keine clientMsgId hat → lokale Kopie wird verworfen, kein Doppelpost - messagesRef + dispatchWithAck prueft vor Send/Retry ob die Bubble bereits delivered ist → kein verspaetetes failed mehr - ARIA-Reply cleart ALLE laufenden ACK-Timer (Bridge hat unsere Messages ja offensichtlich verarbeitet) Docs: - issue.md: neuer Block 'Chat-Stabilitaet' mit den drei Etappen + beiden Race-Fixes; AsyncStorage-Race-Punkt aus 'Offen' abgehakt - README.md: Chat-Such-Zeile aktualisiert (highlight statt filter), Jump-to-Bottom + Delivery-Status-Bubbles dokumentiert Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 23:46:58 +02:00
duffyduck	db4bebfa57	docs: README + issue — drei GPS-Trigger-Modi + Tick-Frequenz-Fix README.md: - Diagnostic-Trigger-Tab-Beschreibung erweitert um die drei GPS-Funktionen (near / entered_near / left_near) mit Use-Cases pro Modus - Plus Auflösung erklaert: 8s-Tick + event-getrieben bei location_update fuer Auto-Vorbeifahrten. 5-min-Age-Schutz gegen Phantom-Fires - Phase B Punkt 5 in der Roadmap entsprechend nachgezogen issue.md: neuer Block "GPS-Trigger-Verbesserungen" mit drei Punkten — Timing-Fix, Age-Schutz, drei Modi. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 18:33:04 +02:00
duffyduck	0fcbf5e3ed	docs: README + issue — Memory-Editor-App + Crash-Reporting + Bugfixes Heute Tag-2 nach dem Memory-Editor-Hauptbau: issue.md: neuer Block "App-Memory-Editor + Crash-Reporting" mit 8 Punkten (Bubble-Header dynamic, Tap-Modal, Inbox, Settings-Editor, RVS-Brain-Proxy, App-Crash-Reporting, memory_search+update Tools, Bugfixes-Cluster). README.md: - App-Features um Notizen-Inbox + Memory-Editor + Bubble-Header dynamic + App-Crash-Reporting ergaenzt - Roadmap um "Memory-Editor in der App" und "App-Crash-Reporting via RVS" als eigene Bullets — beide sitzen unter dem letzten Memory-Anhaenge-Eintrag und schliessen damit den App-UX-Loop: ARIA hat jetzt im Diagnostic UND in der App vollwertiges Memory- CRUD inkl. Anhaenge, plus Crashes sind ohne ADB diagnostizierbar. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 17:30:15 +02:00
duffyduck	27c04a2874	docs: README + issue — Memory-Anhaenge mit Vision-Pipeline (Stufen A-E + attach_paths) issue.md: neuer Block "Memory-Anhaenge mit Vision (Stufe A-E + attach_paths)" mit den 7 Punkten (Storage-Layer, Backend-Endpoints, Diagnostic-UI, App-UI, System-Prompt-Integration, Vision via Read- Tool, attach_paths fuer einarmigen memory_save+attach-Workflow). README.md: Diagnostic-Gehirn-Tab-Beschreibung um 📎-Anhaenge erweitert, plus neuer Roadmap-Eintrag "Memory-Anhaenge mit Vision-Pipeline" der das End-to-End-Erlebnis erklaert (User-Foto → ARIA liest via Read → extrahiert Kennzeichen/Marken/Texte → speichert als Memory mit Foto- Anhang → spaetere Detail-Fragen lassen ARIA das Bild nochmal lesen). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-13 03:16:20 +02:00
duffyduck	331c1437be	docs: README + issue — DB-Truth-Block + memory_save + Search-Modi + Muelltonne dokumentiert Was alles seit dem letzten Doc-Update dazukam: issue.md (Bugfixes): - Cold Memory Crosstalk durch Score-Threshold - Pinned-/Type-Filter bei aktiver Suche - Memory-Liste refresh nach Delete - Thinking-Indikator im RVS-Chat wieder sichtbar - Memory-Suche filtert Rauschen (score_threshold am Endpoint) - Cessna-Phantom-Wissen aus System-Prompt raus - Claude-Code-Auto-Memory abgeklemmt (tmpfs) issue.md (Features): - Neuer Block "Memory-System (Phase B Punkt 5+ Bonus)" mit memory_save Tool, Volltext-Suche, Advanced Search, Muelltonne, Druckansicht, klappbare Kategorien - Neuer Block "DB als Single Source of Truth" mit brain-import als Drop-Folder, DB-Cleanup 60→31, .claude/aria-vm.env Setup README.md: - aria-data/brain-import Tabelle-Beschreibung aktualisiert - .claude/aria-vm.env als neue Zeile in der Konfig-Tabelle - Diagnostic Gehirn-Tab Beschreibung ausgebaut (Wortlich/Semantisch, Advanced Search, klappbare Kategorien, Druckansicht) - App-Features: Muelltonne pro Bubble erklaert - Roadmap-Eintrag "Single Source of Truth — Qdrant" als zentrales Abschluss-Item nach Tool-Use-Patch Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-13 02:23:09 +02:00
duffyduck	9ea7908fe4	docs: README + issue — Proxy-Tool-Use-Patch + Trigger-Reply-Push dokumentiert Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-12 01:52:04 +02:00
duffyduck	0ff44d99c4	docs: README + issue — Aktuelle-Zeit-Block + in_seconds dokumentiert Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-12 01:22:14 +02:00
duffyduck	7107ce4fdd	docs: README + issue — Triggers, GPS-Tracking, Bug-Fixes nachgezogen README: Trigger-Tab in Diagnostic-Tabs-Listen, App-Feature "GPS-Tracking (kontinuierlich)". issue.md: neuer Block "Triggers-System (Phase B Punkt 5)" + 8 frische Bug-Fixes oben (agent_activity-Haenger, Such-Scroll, STT-Bubble-Timing, Diagnostic Brain-Antworten, Brain-Card-Live-Status, App-Chat-Sync, Konversation-Reset-Doppelschlag, OpenClaw-Ghost-IDs). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-12 01:07:30 +02:00
duffyduck	e2dd47255e	docs: README + issue.md — App-Chat-Sync-Verhalten praezisiert App-Chat-Sync ist seit Commit `3497aa2` "Server is Source of Truth" — bei jedem Reconnect KOMPLETTER Server-Stand statt incremental. Doku angepasst: - App leert sich wenn Server leer ist (z.B. nach "Konversation zuruecksetzen") - Lokal-only Bubbles bleiben erhalten (Skill-Notifications, Voice ohne STT) - Bridge schreibt chat_backup.jsonl pro Turn — als Server-Backing-Store Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-11 23:56:14 +02:00
duffyduck	f61864282e	docs: README + issue.md mit Token-Metrics + Diagnostic-Tabs aktualisiert README.md - Phase B erledigt-Liste um zwei Punkte erweitert: Token/Call-Metrics + Multi-Select-Datei-Manager - Diagnostic-Tabs in der Installations-Sektion aktualisiert (5 Tabs statt 4 — Skills als eigener Tab) - Diagnostic-Sektion weiter unten: Tabs-Liste komplett ueberholt, Token-Metrics als eigener Bullet in "Was zusaetzlich drin steckt" issue.md - "Token/Call-Metrics" als erledigter Punkt in "Diagnostic/App-Features" Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-11 23:45:37 +02:00
duffyduck	eeedcc4781	docs: README + issue.md — Phase B komplett (Punkte 2/3/4 + drumherum) README.md - Phase A erledigt-Liste erweitert: Info-Buttons, Multi-Select+ZIP, App-Datei-Manager - Neue Sektion "Phase B — Brain mit Memory + Loop + Skills" mit allen 3 Hauptpunkten (Migration / Conversation-Loop / Skills-System) abgehakt - Plus drumherum: Sprachmodell-Setting, App-Chat-Sync, Chat-Suche Next/Prev - Phase 2: "Erste Skills bauen lassen" — primaerer naechster Schritt issue.md - "Brain — Phase B (komplett)" Sektion oben — strukturiert in Infrastruktur / Memory / Conversation-Loop / Skills / Diagnostic+App - Alle Phase-B-Punkte abgehakt, mit Detail-Bullets - Offen-Liste: Tool-Use-Verifikation (claude-max-api-proxy tools-Param) explizit als ToDo, plus "Erste Skills bauen lassen" als Use-Case Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-11 23:36:50 +02:00
duffyduck	96a1f90ac3	docs: README + issue.md auf die neue Brain-Architektur README.md - Architektur-Diagramm: aria-core (OpenClaw) raus, qdrant + brain rein - Tabelle der Deployments aktualisiert - .env-Beschreibung: minimal, nur Tokens + RVS, Rest lebt in runtime.json (gepflegt ueber Diagnostic) - aria-setup.sh-Beschreibung: nur noch SSH-Key-Setup - Datenverzeichnis-Baum: brain/qdrant + brain/data + brain-import - Docker-Volumes-Tabelle neu (Bind-Mounts statt named Volumes) - Diagnostic-Tabs (Main, Gehirn, Dateien, Einstellungen) ersetzen die alte Feature-Liste - Backup/Reset-Sektion: drei Wiederherstellungswege (brain-import Migration, Bootstrap-Snapshot, komplettes Gehirn) - Container-Restart statt doctor/aria-restart - docker-Befehle: brain/qdrant statt aria-core - Phase A erledigt-Liste + Phase B Status (Punkte 1-4 erledigt: Brain-Skeleton, Migration, Conversation-Loop, Skills-System) issue.md - "Brain (Phase B)"-Sektion ganz oben unter Offen - 9 erledigte Refactor-Punkte abgehakt - Aria-core-spezifische TODOs entfernt (Compact-Auto, Session-Reset, alle-.env-via-Diagnostic war eh schon erledigt) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-11 22:24:53 +02:00
duffyduck	d60c7e9110	docs(issue/readme): heutige Features dokumentiert — ARIA-Files, Reparatur-Buttons, Pinch-Zoom, Auto-Compact Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-11 19:20:10 +02:00
duffyduck	af7b2674f3	docs: Auto-Resume + Edge-Cases in issue.md + README issue.md: Audio-Tabelle erweitert um 'neue Frage waehrend Anruf' und 'Anruf vorbei nach neuer Frage'. Mechanismen-Liste ergaenzt mit 'Audio-Ausgabe waehrend Telefonat' (state-change Logik) und 'neue Frage verwirft pending Resume'. Drei neue Erledigt-Eintraege fuer VoIP, Auto-Resume und PcmPlaybackFinished-Event. README: kompakte Audio-Tabelle ergaenzt + Roadmap zwei neue Bullets. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 12:41:34 +02:00
duffyduck	e3e841f2ab	feat(audio): Auto-Resume nach Anruf ab der gemerkten Position Stefans Idee: Position beim Halt merken (Date.now() - playbackStart - leadingSilence), nach dem Auflegen ab da weitermachen. Wenn der Cache noch nicht komplett ist (final-Marker kam waehrend Anruf), warten wir bis zu 30s auf das WAV — meistens ist's schon da weil das Telefonat laenger als die Antwort dauerte. audio.ts: - captureInterruption(): merkt position + messageId, returnt Sekunden - resumeFromInterruption(maxWaitMs): wartet auf WAV-Cache, lädt mit Sound, setCurrentTime(position), play - Tracking-Felder: playbackStartTime, currentPlaybackMsgId, pausedX phoneCall.ts: - _haltForCall ruft captureInterruption() VOR haltAllPlayback - _resumeAfterCall triggert resumeFromInterruption(30s) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 12:37:35 +02:00
duffyduck	dfba5ceb1f	docs: Audio-Verhaltens-Tabelle in issue.md + README Definiert klar wann Spotify pausiert und wann nicht — als Referenz fuer kuenftige Bug-Reports. Aktueller Zustand nach den Audio-Fixes: Spotify pausiert nur waehrend User-Aufnahme + TTS-Wiedergabe, nicht waehrend ARIAs Denkphase. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-10 12:00:41 +02:00
duffyduck	0c18090351	chore: Highlight-Trigger raus + letzte Piper-Reste aufgeraeumt Highlight-Trigger: - diagnostic/index.html: Settings-Sektion + Trigger-Liste-Handler raus - diagnostic/server.js: get_triggers / save_triggers Action-Handler + TRIGGERS_FILE Konstante + handleGetTriggers/handleSaveTriggers Funktionen weg - README.md: highlight_triggers.json aus dem Datenverzeichnis-Diagram entfernt Die Auswertung war seit Piper-Removal eh tot — die Datei wurde nur noch geschrieben aber nirgends gelesen. Piper-Reste: - bridge/aria_bridge.py: Modul-Docstring auf F5-TTS aktualisiert, Ramona/Thorsten-Erwaehnungen raus, Inline-Kommentar zu "Komponenten TTS" gefixt - aria-data/config/AGENT.md: Stimmen-Tabelle (Ramona/Thorsten) durch Hinweis auf F5-TTS Voice-Cloning ersetzt - aria-data/config/BOOTSTRAP.md: gleiche Tabelle weg, Bridge-Beschreibung auf "orchestriert STT/TTS via Gamebox-Bridges" geaendert Erledigt-Eintraege in issue.md + README markiert (historisch erhalten). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 23:47:55 +02:00
duffyduck	d6b54d3247	feat(audio): Background-Service auch fuer Wake-Word + Aufnahme + Doku-Split Erweitert den Foreground-Service um den microphone-Type damit nicht nur TTS, sondern auch Wake-Word-Lauschen und aktive Aufnahmen weiterlaufen wenn die App im Hintergrund ist. Slot-System (backgroundAudio.ts): - 'tts' : ARIA spricht - 'rec' : Aufnahme laeuft - 'wake' : Wake-Word lauscht passiv (Ohr aktiv) Mehrere Slots koennen unabhaengig acquired/released werden, der Service laeuft solange mindestens einer aktiv ist. Notification-Text passt sich dynamisch an den hoechstprioren Slot an (tts > rec > wake). Wiring (ChatScreen): - onPlaybackStarted/Finished → 'tts' Slot - audioService.onStateChange (recording) → 'rec' Slot - wakeWordService.onStateChange (off→armed/conversing) → 'wake' Slot AndroidManifest: - foregroundServiceType="mediaPlayback\|microphone" (Pflicht ab Android 14 fuer Background-Mic-Zugriff) - FOREGROUND_SERVICE_MICROPHONE Permission Doku: - issue.md Erledigt-Sektion in "Bugs / Fixes", "App Features" und "Infrastruktur" gesplittet - README: Background-Service-Beschreibung erweitert Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 23:43:24 +02:00
duffyduck	ead28cf09a	feat(audio): Foreground-Service haelt TTS am Leben bei minimierter App ARIAs Antwort wird jetzt auch dann fertig vorgelesen wenn der User die App im Hintergrund schickt. Vorher hat Android den Prozess kurz nach dem Minimieren eingefroren — TTS verstummte mitten im Satz. Native: - AriaPlaybackService.kt: Service mit foregroundServiceType=mediaPlayback, zeigt persistente Notification "ARIA spricht — antippen oeffnet die App" (channel low-priority, ongoing, tap → MainActivity) - BackgroundAudioModule.kt: RN-Bridge mit start()/stop() - AndroidManifest: FOREGROUND_SERVICE + FOREGROUND_SERVICE_MEDIA_PLAYBACK + POST_NOTIFICATIONS Permissions, Service deklariert JS: - backgroundAudio.ts: idempotenter Wrapper (active-Flag verhindert doppelte start/stop calls) - ChatScreen onPlaybackStarted → startBackgroundAudio - ChatScreen onPlaybackFinished → stopBackgroundAudio - audio.ts stopPlayback ruft auch stopBackgroundAudio damit die Notification bei Cancel/Barge-In/Anruf nicht haengen bleibt Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 23:37:46 +02:00
duffyduck	e0c1a4bcd5	feat: GPS-Position bei jeder Nachricht an aria-core (still, nur bei Bedarf) App: GPS-Toggle in Settings → Allgemein → Standort wird jetzt korrekt in AsyncStorage persistiert (key: aria_gps_enabled). ChatScreen pollt den Wert mit den anderen Settings im 2s-Intervall. Bridge: chat/audio-Handler nutzen jetzt einen gemeinsamen _build_core_text Helper, der je nach Kontext einen Hint vorschaltet: - Barge-In ("[Hinweis: Stefan hat dich unterbrochen ...]") - GPS ("[Stefans aktuelle GPS-Position: lat, lon. Nutze die nur wenn die Frage sich auf seinen Standort bezieht. Erwaehne sie nicht von dir aus, ausser er fragt explizit danach.]") ARIA weiss bei "wo bin ich?" / "Wetter hier?" automatisch was zu tun ist — bei normalen Fragen kommt die Position aber nicht ungefragt vor. Der User sieht im Chat-Verlauf nichts von der GPS-Info, nur ARIAs Antwort kann darauf eingehen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 23:29:34 +02:00
duffyduck	6651f5937d	feat(audio): Wake-Word parallel zu TTS mit AcousticEchoCanceler Du kannst jetzt "Computer" sagen waehrend ARIA noch redet — TTS verstummt, neue Aufnahme startet. Vorher musste man warten oder manuell den Voice-Button tappen. Native (OpenWakeWordModule.kt): - AudioRecord-Source von MIC auf VOICE_COMMUNICATION (aktiviert auf den meisten Geraeten Echo-Cancellation + Noise-Suppression) - Zusaetzlich AcousticEchoCanceler/NoiseSuppressor/AutomaticGainControl explizit aktiviert wenn vorhanden — robuster auf Geraeten wo die VOICE_COMMUNICATION-Source die Effects nicht automatisch mitbringt - releaseAudioEffects() im stop/dispose JS (wakeword.ts): - Neue API: startBargeListening / stopBargeListening — Wake-Word parallel aktivieren, ohne den State 'conversing' zu verlassen - onWakeDetected unterscheidet jetzt: in 'conversing' → barge-in- Callback (nicht der normale wake-callback). Sonst Standard-Pfad. - onBargeIn-Subscriber-API + isBargeListening-Getter Lifecycle-Wiring (audio.ts + ChatScreen): - audioService.onPlaybackStarted callback (neu) - ChatScreen: Bei TTS-Start → wakeWord.startBargeListening - ChatScreen: Bei TTS-Ende → wakeWord.stopBargeListening (sonst kein AudioRecord fuer die naechste Aufnahme) - ChatScreen: Bei BargeIn → haltAllPlayback + cancel_request + 150ms-Pause + neue Aufnahme starten issue.md + README aktualisiert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 22:50:09 +02:00
duffyduck	e9e7dd804f	docs: issue.md + README mit audioRequestId-Fix + Bereit-Sound aktualisiert issue.md: drei neue Erledigt-Eintraege (Placeholder-Race per audioRequestId, Mikro-Offen-Toast erst nach Recording-Start, Bereit- Sound mit Toggle). Neuer Offen-Eintrag: Wake-Word parallel zu TTS mit AcousticEchoCanceler. README: Wake-Word-Bedienung erweitert um Ding-Dong + "🎤 sprich jetzt"-Toast. Roadmap mit den beiden neuen Features ergaenzt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 22:44:03 +02:00
duffyduck	2a56ac0290	docs: issue.md + README aktualisiert mit aktuellen Features issue.md: openWakeWord, ABI-Split, Underrun-Schutz, Conversation-Focus, PhoneStateListener, Voice-Override-Fix, Bild+Text-Merge, Diagnostic-UI, adaptive VAD, Max-Aufnahme konfigurierbar, Barge-In, Push-to-Talk-Refactor, Settings-Sub-Screens, Textauswahl-Fix in Erledigt verschoben. Porcupine-bezogene offene Bugs entfernt (Engine gewechselt). Neue Offene: STT-Placeholder-Replacement, Custom-onnx-Upload, Pause+Resume bei Anruf. README: Push-to-Talk-Erwaehnung raus, VAD-Beschreibung auf adaptiv + neuen Default 5min, neue Bullets fuer Barge-In + Anruf-Pause, Roadmap ergaenzt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 22:13:53 +02:00
duffyduck	309df9d851	fix(wake-word): Embedding-Output ist rank-4, nicht rank-2 — Trigger funktioniert jetzt Hauptursache warum kein Wake-Word je triggerte: das Google-Speech- Embedding-Modell liefert (1,1,1,96), nicht (1,96). Der Cast `as Array<FloatArray>` warf eine ClassCastException, die vom try/catch geschluckt wurde — Pipeline lief still ins Leere. Zusaetzlich: - WW-Input-Frame-Count wird jetzt aus den Modell-Metadaten gelesen (variiert pro Keyword; hey_jarvis=16, computer_v2evtl. anders) - "Computer" als Wake-Word erweitert (Community-Modell aus fwartner/home-assistant-wakewords-collection) "ARIA" als Wake-Word: gibt's nicht fertig trainiert. Muesste ueber das openWakeWord Colab-Notebook trainiert werden (~1h auf gratis-GPU). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-26 13:24:47 +02:00
duffyduck	55cfb752a2	feat(app): Wake-Word komplett on-device via openWakeWord (ONNX) Picovoice/Porcupine raus — neuer Stack ist openWakeWord (Apache 2.0, on-device, ONNX Runtime). Kein API-Key, keine Lizenzgebuehren, Audio verlaesst das Geraet nicht. Eigene Wake-Words sind via openWakeWord- Notebook gratis trainierbar. Pipeline (alles im OpenWakeWordModule.kt): 1. AudioRecord 16kHz mono int16 in 1280-Sample-Chunks (80ms) 2. melspectrogram.onnx → 32-mel Frames (mel/10 + 2 wie in Python) 3. embedding_model.onnx, 76-Frame Sliding Window (stride 8) → 96-dim 4. hey_jarvis.onnx (oder anderes Keyword) auf letzten 16 Embeddings 5. Sigmoid-Score, threshold/patience/debounce-Filter 6. RN-Event "WakeWordDetected" raus Mitgelieferte Modelle in assets/openwakeword/: hey_jarvis (Default), alexa, hey_mycroft, hey_rhasspy. Externe Service-API (start/stop/ configure/onWakeWord/...) bleibt identisch — ChatScreen unveraendert. build.gradle: com.microsoft.onnxruntime:onnxruntime-android:1.17.1 package.json: @picovoice/porcupine-react-native + voice-processor raus SettingsScreen: AccessKey-Feld weg, neue Keyword-Liste mit Labels README: Wake-Word-Sektion komplett umgeschrieben (kein Picovoice mehr) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-26 12:56:33 +02:00
duffyduck	44d2c6b4fe	fix(app): Spotify-Bounce zwischen ARIA-Antworten + Wake-Word-Doku AudioFocus wird jetzt mit 800ms Verzoegerung freigegeben — wenn ARIA direkt eine zweite Antwort hinterherschickt oder das Recording ins TTS uebergeht, wird das Release abgebrochen. Spotify/YouTube haben damit keine Mikro-Sekunden-Luecke mehr zum Hochkommen waehrend ARIA spricht. README: neue Sektion zur Wake-Word-Einrichtung mit Picovoice (7-Tage-Trial, Console-Link, Anleitung fuer eigene Keywords) und veraltete Wake-Word-Limitation entfernt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 22:49:45 +02:00
duffyduck	4f494daffb	docs: BigVGAN-Warnung deutlich — funktioniert nicht mit unserem Vocos-Setup Die BigVGAN-Variante des aihpi F5-TTS Checkpoints ist nicht einfach ein "optional besser" Fallback — sie ist mit dem Default-Vocos-Vocoder den die f5-tts Library laedt inkompatibel. Output wird NaN, App bleibt stumm. Stefan hat das probiert, App stumm, 10 Minuten Debugging. README war zu locker formuliert ("Meist hoehere Quali") — jetzt klar als "funktioniert AKTUELL NICHT" gekennzeichnet. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 19:49:54 +02:00
duffyduck	5ba89c7191	docs: README-Abschnitt fuer deutsches F5-TTS Fine-Tune (aihpi) Konfig-Tabelle mit den konkreten Diagnostic-Werten fuer das deutsche Fine-Tune von aihpi/F5-TTS-German — Modell-Architektur, hf:// Pfade, empfohlene cfg_strength / nfe_step. Plus Hinweis auf die BigVGAN- Variante als Alternative. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 19:34:36 +02:00
duffyduck	578ade3544	docs: README + issue.md auf Stand mit F5-TTS, Whisper-Gamebox, App-Settings README: - Architektur-Diagramm: Gamebox-Stack mit f5tts-bridge + whisper-bridge - Voice Bridge: STT primaer remote (Gamebox), TTS via F5-TTS - Diagnostic-Section: Voice-Status, Disk-Voll Banner, Auto-Transkription - App-Features: VAD-Toleranz/Pre-Roll/Audio-Pause konfigurierbar - XTTS-Section ersetzt durch "Gamebox-Stack — F5-TTS + Whisper" - Roadmap Phase 1: alle juengsten Erledigungen ergaenzt issue.md: alle erledigten Punkte der letzten Iterationen aufgenommen (Pre-Roll, Decimal-TTS, voice_ready, Whisper-Gamebox, F5-TTS, AudioFocus Pause, VAD-Setting, ...). Offene Liste auf den aktuellen Stand reduziert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-24 14:51:27 +02:00
duffyduck	f801d99748	feat: Piper komplett entfernt — nur noch XTTS v2 als TTS Breaking Change: wenn XTTS-Bridge (Gaming-PC) offline ist, bleibt ARIA stumm. Chat-Antworten kommen weiter an, aber kein Audio. Das ist bewusst akzeptiert — XTTS klingt einfach grauenhaft viel besser. Bridge (aria_bridge.py): - from piper import ... raus - VoiceEngine-Klasse komplett entfernt (synthesize, speak, select_voice) - EPIC_TRIGGERS + load_epic_triggers raus (Highlight-Voice-Feature ohne Piper sinnlos) - self.voice_engine, voice_name, requested_voice Aufrufe weg - _process_core_response: immer XTTS, kein Fallback - tts_request Handler: immer XTTS - config Handler: nur ttsEnabled + xttsVoice + whisperModel - import wave raus bridge/requirements.txt: piper-tts raus bridge/Dockerfile: Kommentar aktualisiert docker-compose.yml: ./aria-data/voices Mount raus aria-data/config/aria.env.example: PIPER_RAMONA/PIPER_THORSTEN raus get-voices.sh: komplett geloescht (war nur Piper-Downloader) Diagnostic UI (index.html): - Piper Panel (Standard-Stimme / Highlight-Stimme / Speed-Sliders) weg - TTS Engine Dropdown weg (immer XTTS) - TTS Diagnose Tab zeigt nur noch XTTS-Status + Test-Button - sendVoiceConfig sendet nur noch ttsEnabled/xttsVoice/whisperModel - toggleXTTSPanel als no-op Legacy-Stub (JS-Calls bleiben safe) Diagnostic Server (server.js): - handleSendVoiceConfig: nur noch ttsEnabled + xttsVoice + whisperModel - handleTestTTS: via xtts_request (nicht mehr Piper subprocess) - handleCheckTTS: via xtts_list_voices ueber RVS - handleGetVoiceConfig/Defaults bereinigt - Highlight-Trigger UI bleibt, wird aber von Bridge nicht mehr ausgewertet (dead-code im UI, spaeter ggf. fuer XTTS-Voice-Switch) README + issue.md aktualisiert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-19 22:24:42 +02:00
duffyduck	271fc4edf6	docs: cleanup.sh + README updates for latest features - cleanup.sh: sicherer (default) + aggressiver (--full) Docker-Cleanup mit Speicher-Report vor/nach - README: Phase-1-Liste, Diagnostic-Features und App-Features um die neuen Punkte ergaenzt (Speech Gate, Session-Persistenz, Session-Export, App Thinking-Indicator, Whisper-Modellauswahl, 16kHz-Aufnahme) - README: Neuer Abschnitt "Docker-Cleanup" mit cleanup.sh Usage Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-18 11:46:12 +02:00
duffyduck	2d23f0668b	docs: update README with conversation mode, multi-attachments, markdown cleanup - Conversation mode (ear button) documented in App Features - Multiple attachments + paste support - Markdown cleanup for TTS - Auto-Update FileProvider + check button - Roadmap: 22 items in Phase 1 completed Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-11 12:43:09 +02:00
duffyduck	3943e79bb1	docs: document .env.example with detailed comments, explain both tokens in README - ARIA_AUTH_TOKEN: Gateway auth (who can talk to ARIA) - RVS_TOKEN: Pairing token (same room in RVS relay) - RVS_UPDATE_HOST: SSH target for auto-update APK copy - All variables with German comments and examples Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-10 08:45:26 +02:00
duffyduck	3461f45207	docs: update README with XTTS v2 setup details, voice cloning guide - Architecture diagram for XTTS flow (Gaming-PC ↔ RVS ↔ ARIA-VM) - Port 8020 (not 8000), token must match, model caching - Voice cloning step-by-step guide - TTS engine switching (Piper/XTTS) with fallback - Known limitation: RVS zombie connections Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-10 01:49:08 +02:00

1 2

66 Commits