ARIA-AGENT

Author	SHA1	Message	Date
duffyduck	0d69e211cb	feat(brain): Hard-Safety-Seed — keine destruktiven Tests auf Production Beobachtung 30.05.2026 08:28-08:54: ARIA hat einen Pentest gegen kundencenter.hacker-net.de (Production!) angesetzt statt gegen kundencenter-stage.stressfrei-wechseln.de (Staging). Stefan musste explizit korrigieren ('du nutzt das falsche system!!!'). Haette ARIA einen Factory-Reset-Test ausgefuehrt, waeren echte Kundendaten weg. Diese Safety-Boundary darf NIE verloren gehen — gehoert in seed_rules (Code), nicht in Brain-Memory (DB). Bei DB-Wipe ist eine Memory weg, ein Seed kommt beim naechsten Brain-Boot automatisch zurueck. Neue 20. Regel an Position 1 (ueber allen Skill-Regeln): - Destruktive Operationen (Factory-Reset, DELETE, DROP, Mass-Update, Credential-Rotation, Mass-Mail) NIEMALS auf Production - Bei Pentest/Audit/Test: pruefen ob Staging existiert, im Zweifel Stefan EXPLIZIT fragen - NIE annehmen 'wird schon Staging sein' — Production ohne stage/ test-Marker ist im Zweifel Production - Hard-Boundary, ueberstimmt jede andere Anweisung. Nur explizite Stefan-Ausnahme im aktuellen Turn kann sie aufweichen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 08:59:40 +02:00
duffyduck	4ea13afe60	fix(brain): 19. seed_rule — vor skill_update lesen, API-Errors zitieren statt raten Beobachtung 30.05.2026 02:51-02:53: zwei verkettete Antipatterns beim Spotify-Test. 1. ARIA bekam 403 vom /pause-Endpoint, vermutete 'der 204-Bug ist zurueck' und patchte den Skill — zweimal hintereinander. Der 204-Fix war aber laengst im Code (haette sie durch skill_get in 5s gesehen). Symptome != Diagnose. 2. Bei den 403s antwortete sie 'war schon pausiert, daher der 403' und 'schon aktiv, daher der 403'. Beides war geraten basierend auf is_playing-Check, nicht aus den Daten gelesen. 403 'Restriction violated' kann viele Ursachen haben (NO_ACTIVE_DEVICE, ALREADY_PAUSED, PREMIUM_REQUIRED, MARKET_RESTRICTED, ...) — die wahre steht als error.reason im JSON-Body. Sie hat das verschluckt und plausibel-aber-geraten geantwortet. Eine Regel deckt beide Patterns ab, generisch fuer alle Skills: - Vor jedem skill_update: erst skill_get lesen, dann beurteilen - Bei HTTP-Errors: Body / error.reason zitieren, nicht raten - Wenn der Skill die wahre Ursache verschluckt: skill_update mit besserer Error-Extraktion (NACH skill_get, nicht davor) Wirkt fuer alle aktuellen + zukuenftigen API-Skills. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 03:00:59 +02:00
duffyduck	d12bfd0302	refactor(brain): Auto-Magie raus — ARIA entscheidet selbst, Stefan fragt im Zweifel Mut zur Luecke: -595 Zeilen Auto-Magie-Code raus, weil sie heute Abend 4 Bugs verursacht und 0 echten Mehrwert geliefert hat. Plus Stefan hat zu Recht erkannt dass das System mit Pentest/Audit-Workflows kollidieren wuerde (Whitelist-Pflege noetig). Weg: - aria-brain/api_heuristic.py geloescht (282 Zeilen Cross-Session- Tracking, Hint-Generation, Bypass-Detection) - aria-brain/agent.py: Auto-Scaffold-Block, Bypass-Detection-Block, _upsert_bypass_lesson-Methode (-146 Zeilen) - aria-brain/main.py: /skills/can-bash-host Endpoint - aria-brain/prompts.py: api_heuristic_section-Parameter - docker-compose.yml: managed-settings-Copy aus proxy-Command - proxy-patches/pre-tool-bash-block.js (PreToolUse-Hook) - proxy-patches/managed-settings.json (claude-CLI Hook-Config) Bleibt (kostet nichts, hilft): - Alle 18 seed_rules (sind in DB, machen keine Last) - skill_scaffold Tool (ARIA kann es manuell nutzen) - Anti-Friedhof + snake_case + Safe-Name-Mapping (passive Validierung) - Versionierung + Rollback (P4, hat sich bei PATH-Bug bewaehrt) - 50k stdout Truncate-Fix scaffold-reflex seed_rule umgeschrieben: kein 'SOFORT scaffold'- Reflex mehr, stattdessen 4-Punkte-Heuristik (parametrisierbar? wiederkehrend? exploratory? im Zweifel: Stefan fragen). Pentest- Workflows bleiben damit ad-hoc Bash ohne false-positive Skill-Vorschlaege. Existierende auto-feedback-Memories in der DB bleiben — sind nuetzliche Lehren, werden nicht mehr automatisch erweitert. Stefan kann sie via Diagnostic-Gehirn-Tab loeschen wenn sie nerven. Dank git ist alles rueckholbar. Wenn doch wieder Auto-Magie gewuenscht: git revert auf `8d5991f`. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 02:47:32 +02:00
duffyduck	8d5991f364	fix(brain): 18. seed_rule — Side-Effect-Tools nicht blind retry'en Beobachtung 30.05.2026 02:22: Stefan bat 'vorheriges lied'. ARIA hat POST /previous gemacht — Spotify gab 204 No Content zurueck (Erfolgs- Antwort ohne Body), aber der alte Skill-Code warf JSON-Parse-Error weil kein Body zum Parsen. ARIA interpretierte das als 'Skill kaputt', patchte ihn UND fuehrte previous nochmal aus. Folge: Stefan landete ZWEI Lieder zurueck statt eins. Aergerlich weil unerwartete Zustandsaenderung. Neue Regel adressiert das: - Side-Effect-Tools (POST/PUT/DELETE, next/previous/play/pause, send- message etc.) sind NICHT idempotent — Retry verdoppelt den Effekt. - Bei unklarem Result IMMER zuerst State pruefen (currently-playing, list-Endpoint etc.), dann beurteilen ob Wiederholung noetig. - HTTP 204 No Content ist KEIN Fehler bei POST/PUT — typische Spotify- Antwort. Skill darf 204 NICHT als Parse-Error werten. - GET-Calls / Search sind retry-safe, hier keine Sorge. ARIAs zweiter Skill-Patch ist uebrigens technisch korrekt (ARG_- Konvention zurueck, 204 handled, strukturierte Ausgabe fuer currently-playing). Nur das doppelte Side-Effect war das Problem. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 02:26:17 +02:00
duffyduck	7d16a0f3e5	fix(brain): 17. seed_rule — ARG_<NAME> ENV-Konvention NIEMALS aendern Beobachtung 30.05.2026: ARIA hat beim skill_update des spotify-Skills die ARG_-Konvention verloren. Statt os.environ.get('ARG_PATH', '') hat sie os.environ.get('PATH', '') geschrieben. PATH ist aber die reservierte Linux-Environment-Variable fuer den Executable-Suchpfad (/usr/local/sbin:/usr/local/bin:...). Folge: Skill las den System-PATH als URL-Pfad, rief https://api.spotify.com/usr/local/sbin:/usr/local/bin:... → 404 zurueck. Stefan dachte Spotify sei kaputt. Rollback noetig (Auto-Archive hat geholfen — alte Version war gluecklicherweise noch da). Neue Regel macht das explizit: - ARG_<UPPER_NAME> ENV ist Pflicht-Konvention vom Skill-Runner - Liste reservierter ENV-Namen die NICHT genommen werden duerfen: PATH, HOME, USER, SHELL, LANG, TERM, PWD, OLDPWD, BRAIN_INTERNAL_URL, SKILL_DIR, SHARED_UPLOADS, CFG_* - Mit Praefix ARG_ keine Kollision moeglich Plus skill_create Tool-Description um den gleichen Hinweis ergaenzt: 'Args lesen via os.environ['ARG_<UPPER_NAME>'] — der Praefix ARG_ ist Pflicht. NIEMALS direkt PATH/METHOD/BODY etc. abrufen — das sind reservierte System-ENV (PATH = Executable- Suchpfad, nicht Dein arg!).' Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 02:17:01 +02:00
duffyduck	0a859f637b	fix(brain): 16. seed_rule — Skills sind erweiterbar, nicht heilig Beobachtung 30.05.2026: Stefan bittet ARIA via skill_update den spotify-Skill so anzupassen dass currently-playing strukturiert ausgegeben wird (Track/Artist/Album/Device/Zeit). ARIA antwortet mit Defensiv-Reflex: 'Der Skill ist nur ein OAuth2-Wrapper, ich kann das nicht im Wrapper bauen — ich schlage einen zweiten Skill spotify_now_playing vor'. Quatsch. Skills sind beliebiger Python-Code. Ein `if path.endswith('currently-playing'): pretty_output()` waere trivial im Skill drin gewesen. Stefan haette das nicht selbst erkennen muessen — genau dafuer ist ARIA da. Neue Regel macht das explizit: - skill_get + skill_update ist der Standard-Workflow fuer Skill-Anpassungen - Skills duerfen if-Verzweigungen, json-Parsing, Output-Filterung, mehrere Endpoints in einem Skill etc. - 'Kann ich nicht in den Wrapper bauen' ist Antipattern - 'Ich schlage einen zweiten Skill vor' ohne erst skill_update zu pruefen ist Antipattern - Stefan ist KEIN Python-Entwickler — er nennt das ZIEL, ARIA baut das WIE. Plus skill_update Tool-Description um den gleichen Gedanken ergaenzt: 'Skills sind ganz normaler Python-Code, du kannst sie beliebig erweitern.' Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 02:09:37 +02:00
duffyduck	8c1476c2ca	fix(brain): 15. seed_rule — Brain-Tools per XML-Tag, nicht als native Tool-Use Beobachtung beim Hook-Deploy-Test (30.05.2026, 01:51-52): ARIA versucht run_spotify zuerst als nativen Tool-Use → 'No such tool available' weil claude-CLI nur seine eigenen Tools (Bash/Read/Write/etc.) kennt; Brain-Tools sind als Prompt-Instruction injiziert. Erst nach dem 'No such tool'-Fehler wechselt ARIA aufs XML-Tag-Format <tool_call name="...">{...}</tool_call>, das der proxy parsed und ans Brain weiterleitet. Dieser Lernzyklus pro Anfrage kostet ~30s. Die Regel erklaert die Architektur (claude-CLI vs Proxy vs Brain) und gibt das richtige Format vor — direkt XML-Tag, nicht native Tool-Use. Beilaeufige Bestaetigung an Stefan: seed_rules.py ist System-Code, wird bei jedem Brain-Lifespan-Start aufgespielt — frische DB nach Wipe wird beim ersten Boot mit den 15 Regeln gesetzt, idempotent ueber migration_key. Im Gegensatz zu brain-import/ (gitignored, manuelle Migration via Diagnostic-Klick). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 01:56:53 +02:00
duffyduck	7d8c411f5c	feat(proxy): PreToolUse-Hook blockiert Bash-curl wenn Skill existiert Variante A endlich umgesetzt: echter Hard-Block vor Bash-Ausfuehrung. Anders als 14 seed_rules + Bypass-Lehre, die ARIA ignorieren kann, ist das ein technisch erzwungener Reject auf claude-CLI-Ebene. Komponenten: 1. aria-brain main.py: neuer Endpoint POST /skills/can-bash-host Bekommt {command}, parst https-URLs raus, prueft gegen aktive Skills (stem-match: 'spotify' im Hostname 'api.spotify.com'). Returnt {block, host, skill, safe_tool} wenn ein Skill den Host abdeckt. 2. proxy-patches/pre-tool-bash-block.js: Node-Script das vom claude-CLI als PreToolUse-Hook fuer das Bash-Tool aufgerufen wird. Liest Tool- Use-Payload via stdin, ruft Brain-Endpoint mit kurzem Timeout (3s), bei block=true → exit 2 mit Stderr-Message. claude-CLI gibt Stderr als tool_use_error an das LLM zurueck — echter Fehler, nicht ignorierbar. Fail-open bei Brain-Down / Timeout / JSON-Fehler: kein Lockout. 3. proxy-patches/managed-settings.json: claude-CLI Hook-Config mit PreToolUse-Matcher 'Bash' der das Node-Script ausfuehrt. /etc/claude-code/managed-settings.json hat Vorrang vor User-Settings und betrifft NICHT Stefans Host-~/.claude/settings.json. 4. docker-compose.yml: proxy-Command erweitert um `mkdir -p /etc/claude-code && cp managed-settings.json dorthin` damit beim Container-Start die Hook-Config aktiv ist. Beobachtung die das motiviert: 14 seed_rules + Bypass-Lehre + Auto-Scaffold + Safe-Names. ARIA hat trotzdem letzten Test mit 2 verschachtelten Bash-curls bedient statt run_spotify zu rufen (content_len=73, tool_calls=0). Prompt-Engineering ausgereizt. ARIA bekommt jetzt: 🚨 BASH GEGEN api.spotify.com BLOCKIERT. Es existiert bereits ein Skill 'spotify' fuer diesen Host. ... Konkret: nutze JETZT `run_spotify` mit den passenden Parametern (method/path/body) statt curl. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 01:49:56 +02:00
duffyduck	fef2a32c50	fix(brain): Skill-stdout-Limit von 2000 auf 50000 — Track-Daten wurden abgeschnitten DER eigentliche Bug warum ARIA Spotify-Tracks halluziniert hat. Lange Diagnose-Session am 30.05.2026 zeigte: ARIA RUFT run_spotify echt auf (im Brain-Log zu sehen als tool_calls=1 + skill liefert echte Daten). Aber bevor das Ergebnis an Claude zurueckging, hat dieser Code: snippet = (res.get("stdout") or "")[:2000] es auf 2000 Zeichen abgeschnitten. Spotify-JSON ist 5-15 KB — "album":{"name":"..."} steht frueh drin (kommt durch), aber "item":{"name":"..."} (Track-Name selbst) und alle Detail-Felder liegen weiter hinten und wurden verworfen. Folge: ARIA bekam nur den Anfang vom JSON inkl. Album-Name, hat dann den bekanntesten Track aus dem Album geraten (Album "Loneliness" -> Track "Loneliness"; Album "Sound Of Belgium" -> Track "House of House"). Semi-Halluzination weil halbe Information. Fix: 50000 Zeichen Limit fuer stdout (Claude verkraftet das locker, hunderte KB Context). stderr von 500 auf 4000. Bei Ueberlauf wird die Original-Byte-Anzahl im Result mitgegeben damit ARIA weiss dass mehr Daten da gewesen waeren. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 01:37:28 +02:00
duffyduck	e7fd918559	fix(brain): zwei neue seed_rules — kein Sub-Agent fuer Skills + Anti-Halluzination Live-Beobachtung am 30.05.2026: ARIA spawnte `Agent` (Sub-Agent) mit Anweisung 'Call run_spotify...' statt das Tool direkt aufzurufen. Der Sub-Agent ist eine isolierte Claude-CLI-Session ohne Brain-Tools, hat also 'No such tool: run_spotify' gemeldet. ARIA hat dann halluzinierte Track-Namen ausgegeben ('Set You Free – N-Trance', 'Tomcraft – Loneliness'), als waeren das echte Spotify-Daten. Drei distinkte Probleme, zwei neue Regeln: 13. seed/skill-rule/no-subagent-for-skills: Brain-Tools (run_, oauth_, memory_* …) NIEMALS via Agent-Subagent aufrufen — die sind isoliert und sehen die Brain-Tools nicht. Direkt in der Haupt-Session aufrufen. Subagent nur fuer Code-Search / Web-Recherche / parallele unabhaengige Aufgaben. 14. seed/rule/no-hallucinated-results (Kategorie 'ehrlichkeit'): Bei Tool-Fail / abgeschnittenem Response / fehlendem Tool: ehrlich sagen, NICHT raten. Anti-Antipattern: 'Stefan vertraut Deinen Antworten — wenn Du raetst und es als Fakt verkaufst, bricht das Vertrauen'. Mit konkreten Formulierungs-Beispielen. Beide Regeln sind erfahrungsbasiert (mit Datum + konkretem Vorfall) — ARIA sieht im Hot-Memory was sie selbst falsch gemacht hat. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 01:29:41 +02:00
duffyduck	bb3c7957aa	fix(brain): re-Modul in agent.py importieren — fehlte fuer safe-name-Mapping Letzter Fix-Commit nutzt re.sub() in _skill_to_tool und im Dispatcher, aber re wurde nie oben importiert. Folge: NameError beim ersten chat() Aufruf nach Restart. Stefan bekam Brain-Error 500. Trivial-Fix: import re bei den anderen stdlib-Imports. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 01:23:58 +02:00
duffyduck	89cafa6251	fix(brain): Skill-Namen snake_case — neue Skills entstehen direkt sauber Stefan-Frage: 'weiss sie in zukunft unterstriche statt bindestriche?' Antwort vorher: nein — Tool-Description sagte 'kebab-case'. Genau das hat die Bindestrich-Skills produziert die gestern die Tool-Liste kippten. Drei Aenderungen: - skill_create Tool-Description: 'kurz, kebab-case' → 'snake_case (NUR a-z 0-9 _). KEINE Bindestriche — die brechen das Tool-Schema beim claude-max-api-proxy. Statt yt-dlp-download → yt_dlp_download.' - skill_scaffold Tool-Description: gleiche Klarstellung. - 12. seed_rule snake-case-names: erklaert das Verbot mit Begruendung (proxy-Limitierung), Beispielen RICHTIG/FALSCH und Hinweis dass historische Skills mit Bindestrich ueber das Safe-Name-Mapping laufen (nicht umbenennen). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 01:19:49 +02:00
duffyduck	1ea7ab5ab1	fix(brain): run_<skill> Tool-Namen safe escapen — Bindestriche kippten Tools-Liste Beobachtung beim zweiten Live-Test (01:13:41): ARIA versuchte echten Tool-Call `run_spotify` — bekam aber Error: 'No such tool available'. Ursache: _skill_to_tool baute Tool-Namen via `run_{s['name']}`. Bei Skills wie 'yt-dlp-download' wurde daraus 'run_yt-dlp-download' mit Bindestrich. Anthropic-Tool-Name-Schema ist eigentlich [a-zA-Z0-9_-], ABER der claude-max-api-proxy konvertiert intern auf OpenAI-Format und faellt bei Bindestrichen um — wenn EIN Tool ungueltig ist, kippt die GANZE Tool-Liste, ARIA sieht nichts von 'run_*' inklusive 'run_spotify' obwohl der ja Bindestrich-frei war. Fix: - _skill_to_tool: name = "run_" + re.sub(r"[^a-zA-Z0-9_]", "_", s["name"]) → run_yt_dlp_download statt run_yt-dlp-download. - Dispatcher: bei tool_name='run_X' wird zuerst X als skill_name probiert, bei Miss wird ueber die Liste der existierenden Skills gemappt — der Skill mit safe_name(name)==X wird dann genommen. - Bypass-Lesson + Bypass-Section: gleiche safe-Logik fuer den empfohlenen run_<tool>-String im Memory/Prompt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 01:17:48 +02:00
duffyduck	15f95ed196	fix(brain): tools nach auto_scaffold neu bauen — sonst halluziniert ARIA Tool-Tags Beobachtung beim ersten Live-Test (00:58:33): Auto-Scaffold legte den spotify-Skill mid-chat() an, all_skills + active_skills wurden refreshed, ABER die `tools=`-Liste die an den Proxy/claude-CLI geschickt wird nicht. Folge: ARIA sah im System-Prompt-Skills-Block dass `spotify` existiert und wusste sie soll `run_spotify` nutzen — aber claude-CLI kannte das Tool nicht weil dessen tool-schema noch ohne run_spotify war. Sie hat dann <tool_call name="run_spotify">...</tool_call> als XML in den Text geschrieben, das wurde nirgends ausgefuehrt (siehe "Pausiert" / "Restricted & NIKSTER" Antworten waren halluziniert). Fix in 4 Zeilen: nach scaffolded_any auch `tools = list(META_TOOLS) + [_skill_to_tool(s) for s in active_skills]` neu bauen. Damit kennt der CLI-Subprocess den frischen Skill-Tool sofort und kann ihn echt aufrufen. Beim naechsten chat-Turn waere es eh richtig (Tools werden neu gebaut), aber genau der erste Turn nach Auto-Scaffold ist der wichtigste — da soll's klappen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 01:03:21 +02:00
duffyduck	210ce62ffe	feat(brain): Skill-Bypass-Detection + Bypass-Lehre als pinned Memory Variante 3+ (Lerneffekt-Variante): Variante C scaffolded zwar Skills auto, aber ARIA lernt nicht — sie wird beim naechsten Mal trotzdem zu Bash greifen. Stefans Punkt: Lernen geht nur ueber Brain-Memory. Mechanik: 1. api_heuristic.detect_recent_bypass(skills, since_sec=600): schaut letzte 10 Min im agent_stream.jsonl, findet Bash-curl gegen Hosts fuer die bereits ein matching Skill existiert. Returnt {host, skill_name, count, last_ts}. 2. api_heuristic.build_bypass_section(events): Drastischer Markdown-Block "## 🚨 SKILL-BYPASS ERKANNT" mit konkretem run_<skill>-Hint pro betroffenem Host. Landet direkt im System-Prompt noch VOR dem normalen API-Heuristik-Block. 3. agent.py._upsert_bypass_lesson(ev): Schreibt eine pinned type=rule Memory mit source=auto-feedback und migration_key=auto/skill-bypass/<skill_name>. Idempotent: bei Wiederholung wird die alte Memory ueberschrieben (Counter aktualisiert), keine Karteileichen. Content nennt konkret den run-Tool-Namen und Performance-Vergleich (3s Tool-Call vs 13-20s Bash-Wrapper). Diese Memory ist permanent pinned → kommt bei jedem Chat-Turn, cross-session, cross-restart als Hot-Memory durch. Damit lernt ARIA es im wortlichen Sinne, nicht nur Reibung in der aktuellen Konversation. Idempotenz wichtig: bei jedem Bypass-Detection-Lauf wird die Memory upgedatet (nicht dupliziert). Stefan kann sie via Diagnostic-Gehirn-Tab loeschen falls sie nervt. Stefan-Frage beantwortet: 'sie wuerde es aber nur lernen wenn sie es auch im gehirn speichert oder?' — exakt. Schimpfen im Prompt ist Reibung dieser Session, pinned Memory ist permanenter Lerneffekt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 00:37:40 +02:00
duffyduck	298b2202a1	feat(brain): Auto-Scaffold — Brain legt Skills selbst an wenn ARIA driftet Variante C: ARIA hat selbst mit Heuristik-Block + 11 seed_rules den expliziten skill_scaffold-Befehl ignoriert (32x Spotify-Bash-Calls in 24h, kein einziger scaffold-Aufruf). Verhaltens-Traegheit ist staerker als jeder Prompt-Hint. Loesung: Brain wartet nicht mehr. Bei jedem chat()-Aufruf wird die Heuristik berechnet. Findet sie einen Host mit bekannter Suggestion (Spotify, GitHub, OpenAI, OpenWeather, Telegram, Microsoft, Discord, Notion, Reddit) der noch keinen Skill hat → Brain ruft selbst `scaffold_skill(name, template, params)` mit author='aria-auto'. Der frische Skill ist sofort im Prompt sichtbar (Skill-Liste wird nach Scaffold refreshed, Heuristik-Cache invalidiert, Hints neu gerechnet). Side-Channel-Event 'skill_created' mit Flag 'auto_scaffolded' geht an die UI — Stefan sieht im Chat dass Brain einen Skill angelegt hat. ARIA findet beim Tool-Use-Loop einen passenden `run_<name>`-Skill vor und nutzt ihn idealerweise statt wieder Bash. Macht sie's nicht und curlt trotzdem weiter, ist der Counter beim naechsten Mal wieder hoch und Brain scaffolded weiter — aber dann ist der Skill ja schon da, also nur ein Pfad. Toggle: BRAIN_AUTO_SCAFFOLD=false zum Abschalten. scaffold-reflex Regel angepasst: ARIA wird informiert dass Brain manchmal selbst scaffolded (author=aria-auto) und sie den Skill via run_<name> nutzen soll statt zu curlen. Bei Hinweisen OHNE Suggestion (unbekannter Host) soll sie selbst skill_scaffold rufen. Stefan-Zitat aus der Diskussion ("ARIA lernt es so nicht"): stimmt inhaltlich, aber pragmatisch wichtiger ist dass Stefans Wartezeit von 20s auf 3s sinkt. Lernen kann sie spaeter — der Skill ist da, sie sieht den Pfad jedes Mal beim Tool-Listing. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 00:28:15 +02:00
duffyduck	845a8b0020	feat(brain): API-Heuristik — Cross-Session-Counter fuer Skill-Drift Variante B: scaffold-reflex Regel allein reicht nicht weil jede Chat- Anfrage eine eigene claude-CLI-Session ist. ARIA sieht in der aktuellen Session nicht dass sie gestern auch schon 10x dieselbe API gecurled hat. Beobachtung: 5+ Spotify-Bash-Calls hintereinander, kein Skill angelegt. Loesung: Brain trackt server-side aus dem persistierten agent_stream.jsonl. Bei jedem chat() wird der Log gescanned (cache 5min), Bash-curl-Calls nach Hostname aggregiert. Hosts mit >=3 Calls in 24h ohne passenden Skill landen als '## API-Heuristik'-Block im System-Prompt mit konkretem skill_scaffold-Vorschlag. Neue Module: - aria-brain/api_heuristic.py: - compute_hints(existing_skills, force): Aggregiert + filtert - build_section(hints): formatiert als kompakten Markdown-Block - Smart suggestions mapping (api.spotify.com → oauth-api template etc.) - Ignoriert interne Hosts (aria-brain, localhost, docker-bridge) - 5-min Cache damit nicht jeder Turn die JSONL parst - aria-brain/prompts.py: build_system_prompt nimmt api_heuristic_section als optionalen Block direkt nach Skills-Section. - aria-brain/agent.py: vor build_system_prompt Heuristik berechnen mit aktueller Skill-Liste, Block durchreichen. - 11. seed_rule scaffold-reflex umgeschrieben: kein 'in einer Session' mehr (das ergab keinen Sinn — jeder Turn neue Session). Stattdessen: '## API-Heuristik'-Block ist Dein Cross-Session-Gedaechtnis. Wenn da was steht: scaffolden BEVOR Du Bash machst. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 00:19:06 +02:00
duffyduck	0540c49c66	feat(brain): skill_scaffold — Templates statt Skill aus dem Nichts Variante C: niedrigere Huerde zum Skill-Bau. Statt einen kompletten Python-Skill via skill_create zu generieren (~100 Zeilen Code, teuer in Tokens und fehleranfaellig), waehlt ARIA ein Template + minimale params, Brain expandiert das Skelett in ~1s zu fertigem Skill. Beobachtung: ARIA driftet bei Spotify, PDF etc. zu Bash-curl statt einen Skill zu bauen, weil die Skill-Bau-Huerde zu hoch ist (Code, README, args, pip_packages, config_schema). Mit Templates ist die Huerde minimal. Neue Module: - aria-brain/skill_templates.py: drei mitgelieferte Templates - oauth-api: OAuth2-API (Spotify, GitHub, Reddit, Google, Discord, ...). Token via BRAIN_INTERNAL_URL/oauth/<s>/token mit Auto-Refresh. Args: method/path/body/base_url - apikey-api: API mit statischem Key (OpenWeather, OpenAI, Twilio). Key liegt im config_schema -> CFG_<NAME> ENV, KEIN hardcoden. Konfigurierbar: auth_header (Authorization\|X-Api-Key), auth_prefix. - file-process: Skelett fuer File-In/File-Out (PDF, Bild, JSON). process()-Funktion ist Stub, ARIA fuellt sie via skill_update. Templates nutzen Token-Replacement statt f-Strings (sonst Konflikt mit dem skill-internen Python-Code). - aria-brain/skills.py: scaffold_skill(name, template, params, author) wrappt create_skill mit den expandierten Feldern. - aria-brain/agent.py: neues Brain-Tool skill_scaffold mit detaillierter Description (Template-Liste + params-Schema). Dispatcher-Handler schickt skill_created Side-Channel-Event analog zu skill_create. - aria-brain/main.py: POST /skills/scaffold + GET /skills/templates (letzteres listet alle Templates fuer UI/Diagnostic). - 11. seed_rule scaffold-reflex: bei 2x derselben API per Bash-curl SOFORT skill_scaffold rufen. Belohnung explizit benannt ("welches lied" von 20s auf 3s). README mit Skills-Scaffold-Tabelle ergaenzt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 00:02:45 +02:00
duffyduck	add303970b	feat(brain): 10. seed_rule — runtime-topology (wo ARIA tatsaechlich laeuft) Beobachtung beim "ueberspringe Lied"-Test (29.05.2026): 47 Sekunden mit 12 fehlgeschlagenen Bash-Versuchen weil ARIA glaubte sie sei im aria-brain Container. Sie hat probiert: - python3/python/jq (Alpine — alle nicht installiert) - cd /data/skills/spotify-control (existiert nur im Brain) - curl localhost:8080/oauth/... (localhost = aria-proxy, nicht Brain) - 8s Timeout auf localhost (kein TCP Reset) Erst nach 9 Versuchen brain:8080 erraten und dann den Token-Wert hardcoded in den naechsten curl gepackt. Die neue Regel beschreibt die echte Topologie explizit: - Du bist die claude-CLI als Subprocess IM aria-proxy (node:22-alpine) - KEIN python3/python/jq verfuegbar - /data/skills/ existiert NUR im aria-brain - localhost in Deinem Bash heisst aria-proxy; Brain ist aria-brain:8080 - BRAIN_INTERNAL_URL ist NUR in laufenden Skills gesetzt - Brain-Resources via Brain-Tools (oauth_get_token, memory_search, run_<skill_name>), NICHT via Bash - SSH zur VM-Host: `ssh aria@host` (ed25519-Key liegt im Proxy) - Externe APIs direkt per curl mit Token aus oauth_get_token Plus das Anti-Pattern dokumentiert ("47 Sekunden Stefan-Lebenszeit") — ARIA soll bei jedem Bash-Reflex gegen "lokale" Brain-Resources erst denken oder die Brain-Tool-Ebene nehmen. README in Skills-Architektur-Sektion entsprechend ergaenzt (10 Regeln). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 23:30:50 +02:00
duffyduck	aaaf118cb7	feat: 2 neue seed_rules + Diagnostic-Persistenz fuer agent_stream + chat-backup API Befund aus chat_backup.jsonl-Analyse heute: ARIA ist 3x auf oauth_authorize gefallen statt oauth_get_token (Stefan musste manuell einloggen), und beim PDF-Skill ist sie nach Stefans "Variante bitte" zu Ad-hoc-Bash-Befehlen auf der VM gedriftet ("ich lass den Code direkt laufen") — Skill wurde unbrauchbar. Beides genau die Antipattern die wir mit den seed_rules abdecken wollten, nur waren die zu schwach formuliert. seed_rules (jetzt 9 statt 7): - oauth-reauth-reflex: bei 401 ZUERST oauth_get_token, NUR bei dessen Fehler oauth_authorize. Stefan zu Re-Login schicken ist das aergerlichste Antipattern (er sitzt im Auto, muss Handy rauskramen). - no-skill-drift: kaputter Skill -> skill_logs + skill_update, NIEMALS zu Ad-hoc-Bash wechseln (Skill wird Karteileiche). Plus: "ich baue dir einen Skill" SAGEN ohne skill_create zu rufen ist verboten — Stefan checkt die Liste und verliert das Vertrauen. agent_stream-Persistenz: - diagnostic/server.js schreibt jeden agent_stream-Event parallel zum Broadcast in /shared/logs/agent_stream.jsonl (soft-cap 50 MB mit half-truncate beim Ueberlauf). - Live-View laedt beim Page-Load + Sub-Tab-Switch die letzten 200 Eintraege via /api/agent-stream. Browser-Reload / Standby verliert damit den Verlauf nicht mehr. Debug-API ohne SSH: - GET /api/chat-backup?lines=N (Default 200, Max 5000) — geparstes JSON der letzten N Zeilen aus chat_backup.jsonl - GET /api/agent-stream?lines=N — gleiches fuer den persistierten Stream README: - Neuer Abschnitt "## Skills — Architektur" mit Skill-Layout, Drei-Stufen-Daten-Modell (OAuth / config_schema / Brain-Daten), Versionierung, Anti-Friedhof, seed_rules (alle 9 aufgelistet). - Diagnostic-Sektion um agent_stream-Persistenz + neue Debug-Endpoints ergaenzt. - Roadmap: Phase B "Skill-Architektur P0-P4" abgehakt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 23:06:56 +02:00
duffyduck	8359500476	feat(skills): P3 config_schema + P4 Versionierung mit Rollback P3 — Skill-Configuration - aria-brain/skills.py: SKILL_CONFIGS_FILE (/shared/config/skill_configs.json) als zentrale Werte-Persistenz. _normalize_config_schema validiert die Schema-Felder (name/type/label/secret/description/default), CFG_<UPPER_NAME> ENV beim run_skill. create_skill + update_skill akzeptieren config_schema. - agent.py: skill_set_config Brain-Tool fuer ARIA. skill_create/update um config_schema-Property erweitert. - main.py: GET/POST /skills/{name}/config — secret-Werte in Antwort gemaskt. P4 — Versionierung mit Rollback - aria-brain/skills.py: archive_current_version archiviert nach versions/v_<ts>/ (ohne venv/logs). update_skill ruft das automatisch auf bevor strukturelle Aenderungen passieren. list_skill_versions, rollback_skill (mit Safety-Snapshot + automatischem venv-Rebuild), delete_skill_version. - agent.py: skill_list_versions, skill_rollback Brain-Tools. - main.py: GET /skills/{name}/versions, POST /skills/{name}/rollback, DELETE /skills/{name}/versions/{version_id}. UI - diagnostic/index.html: Skill-Detail um Config-Form (typ-spezifisch, Secrets als password-Input mit *SET*-Hinweis) und Versions-Liste mit Rollback-/Delete-Button. - android SkillBrowser: SkillDetailModal laedt config_schema + versions on-mount. Config-Form (TextInput + Switch fuer boolean), Versionen mit Rollback-Confirm. brainApi um SkillConfigField/SkillVersion + getSkillConfig/setSkillConfig/listSkillVersions/rollbackSkill/ deleteSkillVersion erweitert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-28 23:52:46 +02:00
duffyduck	1a72f27861	feat(brain): seed_rules erweitert — BRAIN_INTERNAL_URL + Auth-Strategie ARIA wusste bisher nichts von BRAIN_INTERNAL_URL — sie hatte den Endpoint zwar, aber keinen Grund ihn zu nutzen. Zwei neue rule-Memories: - "BRAIN_INTERNAL_URL ist deine Brain-Schnittstelle" — listet die wichtigsten Endpoints (oauth/<service>/token, memory/search, memory/pinned, skills/list) und macht klar dass auch Daten wie Stefans Standort, Memories oder andere Skills aus dem Skill heraus abrufbar sind. - "Auth-Strategie fuer externe APIs" — zwingt ARIA bei jedem API-Skill in eine Checkliste: erst OAuth2 pruefen (Spotify, Google, GitHub, Reddit, …), sonst statischer Key per config_schema, NIEMALS hardcoden. Damit kommt sie eigenstaendig auf "Spotify = OAuth2 = Brain-Endpoint" ohne dass Stefan das jedes Mal sagen muss. Insgesamt jetzt 7 seed_rules statt 5. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-28 23:11:02 +02:00
duffyduck	32302a841e	feat(brain): Skills holen OAuth-Tokens vom Brain + Anti-Friedhof-Check P1+P2-Infrastruktur: - Neuer Endpoint GET /oauth/{service}/token liefert aktuelles access_token mit Auto-Refresh (< 60s Restzeit). Skills rufen das ueber BRAIN_INTERNAL_URL ab statt client_secret hardzucoden. - run_skill setzt BRAIN_INTERNAL_URL als ENV (Default http://localhost:8080, override via Brain-Env). Skills laufen im Brain-Container, localhost passt. - skills.create_skill: _check_anti_graveyard rejected Versions-Suffixe (-v2, _v3, -new, -fixed, -old, -alt, -copy, -final, -clean) und Prefix-Kollisionen (z.B. spotify-aria wenn spotify schon existiert) — die zwei Patterns hinter dem alten Skill-Friedhof. Tool-Description fuer skill_create um PFLICHT-VORHER-Block ergaenzt (skill_list, kein Versionssuffix, oauth_get_token, config_schema) damit ARIA die Regeln direkt im Schema sieht. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-28 23:04:22 +02:00
duffyduck	474e2c6c50	feat(brain): Skill-Regeln als seed_rules — idempotent auf Brain-Boot in DB Stefans Skill-Friedhof (9 Spotify-Skills, hardcoded Credentials) hatte keine systemische Ursache im Code, sondern im fehlenden Leitplanken- Memory. Lösung: System-Seed-Regeln als pinned Hot Memory, mit jedem Deploy ausgerollt. - aria-brain/seed_rules.py: 5 rule-type Memories (skill_list-vor-create, no-version-suffix, update-not-recreate, no-hardcoded-credentials, config-schema-for-settings), source="seed", pinned=true - Lifespan ruft seed_rules.apply() beim Brain-Start — idempotent via migration_key (alte Versionen werden vor dem Schreiben gelöscht) - skill_create Tool-Description um PFLICHT-VORHER-Block ergänzt: skill_list-check, kein Versionssuffix, oauth_get_token bei OAuth, config_schema statt hardcoded Werte Editieren = SEED_RULES-Liste anpassen, Brain neu starten. Im Gegensatz zu brain-import/ (User-Saatgut, gitignored, manueller Diagnostic-Klick) gehört das hier zum Brain-Code und rollt mit jedem Deploy aus. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-28 22:55:05 +02:00
duffyduck	13e87fb083	feat(oauth): ARIA kann Provider selbst registrieren + Custom-Provider in Diagnostic & App ARIA hat jetzt das META-Tool oauth_register_provider. Wenn Stefan einen Service nutzen will, der nicht in den (auf Spotify reduzierten) Defaults ist, kann sie auth_url/token_url/scopes/client_auth selbst eintragen — ARIA kennt typische OAuth-Endpunkte (Dropbox, Discord, Notion, Slack, Zoom, Trello, LinkedIn, Reddit, Twitch) aus ihrem Training. Sie traegt NUR die URLs ein, client_id/secret bleiben Stefans Job (Diagnostic / App-UI) — bewusste Trennung damit Credentials nicht im Chat-Verlauf landen. DEFAULT_PROVIDERS auf Spotify reduziert — Rest war aktuell ungenutzt und macht den Code unnoetig "groß". ARIA registriert on-demand. Diagnostic-UI: - Custom-Provider zeigen auth_url/token_url/scopes als sichtbare Felder - Defaults verstecken die Felder hinter "Default-URLs ueberschreiben (advanced)" damit man die Spotify-URLs nicht versehentlich loescht - "+ Custom OAuth-Provider hinzufuegen" Button mit Prompts fuer Name/URLs/Scopes - 🗑-Icon bei Custom-Services (Service komplett entfernen) App-UI (neu fuer unterwegs): - Settings → Sektion 🔑 "OAuth-Apps" zwischen Skills und Protokoll - OAuthBrowser-Komponente analog zu Trigger/Skill-Browser: Liste mit Status, Tap → Edit-Modal mit client_id/secret + Advanced-Toggle fuer URLs. "Autorisieren ↗" oeffnet System-Browser via Linking.openURL, redirected zur RVS-Callback-Page, Status-Refresh nach 8s. - "+ Custom"-Button → Full-Screen-Modal fuer Service-Anlage. - brainApi um listOAuthServices/getOAuthApps/saveOAuthApp/ deleteOAuthApp/authorizeOAuth/revokeOAuth erweitert. Workflow ist jetzt: "verbinde mich mit Dropbox" → ARIA registriert Provider → "trag client_id/secret in Settings ein" → Stefan macht das in App oder Diagnostic → "Autorisieren ↗" → fertig. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-24 20:16:31 +02:00
duffyduck	30c1dd7473	feat(app+brain): App-Bugfixes + Skill-Mgmt-Tools + Voice-Speed persistent + Skill-Browser App-Bugs: - Trigger-Liste war leer: brainApi.listTriggers() cast'te {triggers: [...]} direkt als Array, t.sort() warf — TriggerBrowser blieb leer. Fix: unwrap. - GPS-Tracking startete erst bei SettingsScreen-Mount, nicht beim App-Boot. Wenn Stefan direkt in den Chat ging, blieb GPS aus. Fix: restoreFromStorage() in App.tsx useEffect. - Text in Chat-Bubbles nicht markierbar / kein Copy-Mechanismus: Bubble jetzt Pressable mit onLongPress + neues ⎘-Icon in Status-Row → openBubbleActions(). Alert-Menu mit "Ganzen Text teilen" + pro extrahierte URL/Mail/Tel eine eigene Option. Share.share() — keine neuen Native-Deps noetig. Brain — Skill-Mgmt: - ARIA legte beim Skill-Umbau neue Versionen mit Suffix an (Skill-Friedhof), weil sie kein Update/Delete-Tool kannte. Zwei neue META_TOOLS in agent.py: skill_update (kann entry_code, readme, pip_packages, args, description, active patchen — venv wird bei pip_packages-Aenderung rebuilt) + skill_delete. - skills.py update_skill um entry_code/readme/pip_packages erweitert, venv-Rebuild bei pip-Aenderung. Bridge — Voice-Speed persistent: - _next_speed_override war pro-Request-Override ohne Persistenz. Bei Diagnostic-Chats / Trigger-Replies ohne vorherigen App-Chat fiel der Speed auf 1.0 zurueck, ebenso nach Bridge-Restart. Jetzt: _persistent_xtts_speed aus voice_config.json (xttsSpeed), wird nach jedem App-chat mit speed autopersistiert. TTS-Generation faellt zurueck: per-Request > persistent > 1.0. App — Feature 6: - SkillBrowser.tsx: Liste aller Skills, Toggle aktiv/inaktiv, Detail-Modal mit Args-Inputs, Ausfuehren mit Live-stdout/stderr, Logs der letzten 20 Runs, Loeschen. Settings-Sektion "Skills" (🛠️) zwischen Trigger und Protokoll. brainApi.listSkills/getSkill/runSkill/updateSkill/deleteSkill/ getSkillLogs ergaenzt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-24 17:24:03 +02:00
duffyduck	1ea614c26b	fix(brain): CPU-only torch — verhindert 5 GB CUDA-Bloat im Brain-Image sentence-transformers zieht torch als Dependency, und der Default-Wheel auf x86_64-linux ist die CUDA-Variante mit allen NVIDIA-Libs (nvidia-cudnn, nvidia-cublas, cuda-toolkit, triton, ...). ~5 GB pro Build-Layer, frisst die 22-GB-VM auf. Fix: torch CPU-Wheel explizit zuerst installieren. Damit ist die torch-Dependency erfuellt wenn sentence-transformers spaeter kommt, und die CUDA-Libs werden nie gezogen. Brain laeuft eh komplett auf CPU (MiniLM-Embeddings ~120 MB), GPU-Bloat war reine Disk-Verschwendung. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-23 15:45:51 +02:00
duffyduck	acaa9fc3f2	feat(oauth): generische OAuth2-Pipeline ueber RVS-Callback (Spotify/Google/GitHub/Strava/MS) Bisher musste Stefan bei OAuth-Flows manuell den Auth-Code aus der Browser-URL kopieren (redirect_uri war localhost). Jetzt: RVS hat einen HTTP-Listener auf demselben Port wie der WebSocket, Provider redirecten nach Auth zu https://{RVS_HOST}/oauth/callback/{service}, RVS broadcastet, aria-bridge forwarded, Brain matched state + tauscht code gegen Token. Token-Refresh laeuft automatisch. - rvs/server.js: hybrid http.createServer + WebSocketServer{noServer}. Route GET /oauth/callback/{service}, broadcast oauth_callback an alle Raeume, schoene Dark-Mode-HTML-Antwort an den Browser (Auto-Close 4s). - bridge/aria_bridge.py: empfaengt oauth_callback, POSTet an Brain /internal/oauth-callback. - aria-brain/oauth.py: neuer Manager. Pending-Store mit state+TTL, Token-Exchange (Basic-Auth oder Body je nach Provider), persistente Speicherung in /shared/config/oauth_tokens.json (mode 0600), Token-Refresh wenn <60s Restzeit. Vordefinierte Configs fuer Spotify, Google, GitHub, Strava, Microsoft. - aria-brain/agent.py: META-Tools oauth_authorize / oauth_get_token / oauth_revoke. - aria-brain/prompts.py: System-Prompt-Block zeigt ARIA die feste Callback-URL als Quelle der Wahrheit + aktuelle Service-States. - aria-brain/main.py: HTTP-Endpoints /oauth/services, /oauth/apps, /oauth/authorize, /oauth/{service}/revoke, /internal/oauth-callback. - diagnostic: neue Section "OAuth-Apps". Pro Service Karte mit Status, client_id + client_secret (Passwort-Toggle), Speichern + Autorisieren- Buttons. Authorize oeffnet Provider-Auth in neuem Tab. - docker-compose.yml: brain-env um RVS_HOST + RVS_PORT_PUBLIC + RVS_TLS ergaenzt (Brain braucht die Werte zum Bau der Callback-URL). - .env.example: RVS_PORT_PUBLIC + Brain-Timeout-Vars (PROXY_TIMEOUT_SEC + Connect/Write/Pool) dokumentiert. - README.md: OAuth-Pipeline + ARIA-Live-Mirror in Diagnostic-Section, OAuth-Apps in Einstellungen-Tab erwaehnt. - issue.md: OAuth-Pipeline + Brain-Timeout-Fix als erledigt dokumentiert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-23 15:39:54 +02:00
duffyduck	0887674497	fix(brain): Proxy-Timeout 20min -> 24h Read, split httpx-Timeouts, Cleanup-Pfade Brain timed bei langen Pentests nach exakt 20:00 min raus, obwohl ARIAs Subprozess fleissig weiterarbeitete und der Live-View alles zeigte. Root-Cause: proxy_client.py hatte einen 1200s httpx.Client-Timeout — genau der Wert, den wir vor 5 Tagen am Proxy auf 24h hochgezogen hatten. Schicht uebersehen. - docker-compose.yml: PROXY_TIMEOUT_SEC=86400 als brain-env. - proxy_client.py: httpx.Timeout split (connect=10, read=86400, write=30, pool=10). Toter Proxy wird in 10s erkannt, lange ARIA-Sessions duerfen 24h laufen. - routes.js handleNonStreamingResponse: res.on("close") + isComplete-Flag. Brain-Disconnect killt jetzt den Subprozess statt ihn verwaisen zu lassen. - agent.py chat(): try/except — bei Exception nach dem User-Turn wird ein Assistant-Error-Marker geschrieben, damit Conversation user->assistant konsistent bleibt (kein Tool-Call-Loop-Fail in Folge-Calls). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-23 14:24:22 +02:00
duffyduck	2d348aeec7	feat(flux): Modell-Wahl per Diagnostic + raw/switch-Keywords + Download-Hinweis Diagnostic-Einstellungen fuer FLUX: - Default-Modell (dev \| schnell) — wird via RVS gepusht, flux-bridge hot-swappt die Pipeline aus dem HF-Cache (~15-30s) - Raw-Keyword (Default 'flux') — Pipe-Modus, Brain leitet Stefans Text 1:1 als prompt durch, kein Rewriting/Beautify - Switch-Keyword (Default 'fix') — zwingt das ANDERE Modell als Default Brain-Tool flux_generate um model + raw erweitert, System-Prompt-Block mit den aktuellen Diagnostic-Settings + Whisper-Toleranz-Hinweis. Kein eager Bootstrap-Load: flux-bridge wartet auf config oder ersten Request. Bei erstem HF-Download zeigt Banner "laedt erstmalig runter" mit Pfeil-Icon, Toast in der App wenn fertig. FLUX_MODEL aus der .env entfernt (Steuerung jetzt komplett ueber Diagnostic). HF_TOKEN-Kommentar erklaert warum trotz lokaler Inference noetig (HF Gate-Mechanismus fuer FLUX.1-dev). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-16 23:11:22 +02:00
duffyduck	7e53dcfed3	feat(flux): Bildgenerierung via FLUX.1-dev — flux-bridge auf Gamebox Eigener Compose-Stack im /flux Verzeichnis (kann auf separater Maschine laufen). aria-bridge routet flux_request via RVS, ARIA referenziert das fertige PNG im Reply mit [FILE: ...]-Marker. Brain-Tool flux_generate mit Caps fuer steps/dimension. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-16 22:33:48 +02:00
duffyduck	71fc90fcb8	fix(brain): Timeouts 5min → 20min — verkettete Timeouts haben lange Multi-Tool-Sessions chronisch gekappt Live-Diagnose auf der VM: drei verkettete 5-Min-Timeouts feuern bei jedem laengeren Brain-Call exakt gleichzeitig: 06:16:02 Brain → Proxy /v1/chat/completions 06:20:53 Bridge kappt (4m51s, urlopen timeout=300) 06:21:02 Brain bekommt HTTP 500 vom Proxy ('timed out after 300000ms') Stefan's Karten-Rekonstruktion (curl gegen Nominatim/OSRM + viele Bash- Tool-Calls + DB-Inserts) braucht locker 8–15 Min — alle Brain-Calls ueber 5 Min sind reihenweise mit 'Brain-Fehler: timed out' verreckt, auch wenn die Arbeit zu 80% durch war. Drei Stellen patchen: - bridge/aria_bridge.py: urlopen 300 → 1200 (20 Min) - aria-brain/proxy_client.py: PROXY_TIMEOUT_SEC default 300 → 1200 - docker-compose.yml: dritter sed-Patch im proxy-Service setzt DEFAULT_TIMEOUT im claude-max-api-proxy von 300000 auf 1200000 Plus App-Watchdog: 180s → 1260s (21 Min, knapp ueber Brain-Timeout) damit der lokale Stuck-Watchdog nicht waehrend legitimer langer Sessions feuert. Echte Verbindungsabbrueche kappen vorher per WS- Disconnect. UX-Tradeoff bewusst akzeptiert: User sieht jetzt bis zu 20 Min nur 'ARIA denkt...' ohne Zwischen-Updates. Echte Loesung waere Streaming oder async-Job-API (siehe Etappe B/C im Vorschlag) — das ist groesseres Refactoring, hier reicht erst mal der Quick-Fix. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-15 08:40:26 +02:00
duffyduck	6037b62612	fix(brain): ARIA legt nicht mehr ungefragt Skills an Prompt sagte 'Harte Regel — IMMER Skill anlegen wenn pip-Library noetig'. ARIA hat das wortwoertlich genommen: bei einer einfachen pdf-extract-Frage hat sie sofort skill_create gerufen → Brain blockiert 12 Min im venv+pip-Install-subprocess.run, App zeigt 'ARIA denkt', Diagnostic emitted nach 5 Min Timeout idle, Stefan blieb stundenlang ohne Antwort. Neue Regel: - Goldene Regel: NIE ungefragt Skills anlegen. - Aufgabe zuerst inline loesen (Bash, direkter pip install, Workaround). - Skill nur wenn Stefan EXPLIZIT sagt 'mach daraus einen Skill' / 'leg den als Skill an'. - Die vier Kriterien (wiederkehrend/nicht-trivial/parametrisierbar/ wiederverwendbar) sind jetzt Checkliste NACH expliziter Anfrage — fehlt eines, soll ARIA nachfragen statt blind anzulegen. - Begruendung steht jetzt im Prompt: Setup blockt Brain bis zu 12 Min. Greift auf der VM ohne Re-Build, prompts.py wird beim Start geladen (docker compose restart aria-brain reicht). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-15 08:14:33 +02:00
duffyduck	435b77e1df	feat(trigger): entered_near + left_near — drei Modi fuer near()-Watcher Stefan: bei aktuellen near()-Watcher gibt's nur "solange drin". Reale Szenarien wollen aber differenzieren: - VORWARNUNG vor Ziel (Blitzer-Warner 2 km vorher) → entered_near mit grossem r - ANKUNFT exakt am Ziel → entered_near mit kleinem r - VERLASSEN (Parkplatz, hast du was vergessen) → left_near - KONTINUIERLICH-DRIN (bin noch in der Naehe?) → near (Default, throttled) Zwei neue Funktionen in der Condition-Whitelist: - entered_near(lat, lon, r): True NUR im Moment des Uebergangs draussen → innen. Fires einmal pro Eintritt. - left_near(lat, lon, r): True NUR im Moment des Uebergangs innen → draussen. Fires einmal pro Austritt. State-Tracking: - pro Trigger pro near-Aufruf wird der letzte Auswertungs-Wert (true/ false) im Watcher-Manifest gespeichert (Field "near_states", Key "lat.6,lon.6,radius"). Background-Loop liest's vor dem Eval, gibt's per collect_variables(prev_near_states=...) in die Closure, schreibt nach dem Eval die neuen Werte zurueck — UNABHAENGIG ob gefeuert wurde, sonst greift die Uebergangs-Erkennung nicht. Background _tick: - Aufteilung in Watcher-Pass (mit prev_near_states pro Trigger) und Timer-Pass (ohne State, gemeinsame vars). Bisher war collect_variables einmal pro Tick — jetzt einmal pro Watcher. Disk-Stats sind teuer aber unter 30 Watchern unkritisch; bei mehr koennen wir cachen. ARIA-Tool-Description erweitert (trigger_watcher): erklaert die drei Modi mit Use-Cases und empfohlenen Throttle-Werten (kurz fuer entered/ left, lang fuer near). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 18:29:39 +02:00
duffyduck	6f80e442cf	fix(trigger): near() fired bei Auto-Vorbeifahrten verpasst — Loop schneller + event-getrieben Stefan ist mehrmals an einem 300m-near()-Watcher (DRK Kreyenbrueck) vorbeigefahren, kein Fire. Ursache: Background-Loop tickte alle 30s, Auto-Durchfahrt durch 600m-Durchmesser-Radius dauert bei 50-120 km/h nur 18-43 Sekunden — der Tick konnte komplett dazwischen liegen. Drei Fixes (A + B aus Stefans Vorschlag): A1. Background-Loop-Frequenz: TICK_SEC 30 → 8. Garantiert mind. 2 Checks auch bei 120 km/h durch 300m. Loop ist billig (paar Dateilesungen + AST-Eval), Brain merkt das nicht. A2. near() bekommt Age-Schutz (watcher.py NEAR_MAX_AGE_SEC=300): Wenn location_age_sec > 5 min, gilt die Position als unbekannt und near() liefert False. Verhindert Phantom-Fires wenn Tracking aus ist oder Mobilfunk weg war — vorher haette der letzte bekannte Wert weiter ausgewertet werden koennen. B. Event-getriebener Tick: - background.py: tick_now()-Funktion + Module-Slot fuer agent_factory damit man von ausserhalb des Lifespan-Pfads einen Tick triggern kann - main.py: POST /triggers/check-now Endpoint ruft tick_now() - bridge: _persist_location feuert nach jedem Save ein fire-and- forget POST /triggers/check-now (run_in_executor, timeout 8s, blockt nichts wenn Brain stockt) Damit fires near() sofort wenn die App ein location_update schickt — Polling ist nur noch der Fallback fuer Watcher OHNE GPS-Bezug (disk_free, hour_of_day etc.) und als Sicherheits-Tick falls location_update mal ausfaellt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 18:16:53 +02:00
duffyduck	f71936da86	feat(memory): Tap auf Memory-Bubble oeffnet Detail+Edit-Modal in der App (Etappen 2+3) Stefans naechste Wunsch-Etappe — komplettes Edit eines Memory-Eintrags aus der App heraus, inkl. Anhang-Upload, ohne Diagnostic-Browser auszuklappen. Backend-Fundament (Phase A): - Brain bekommt GET /memory/get/{id} fuer Einzel-Lookup mit allen Feldern - RVS ALLOWED_TYPES um brain_request + brain_response erweitert - Bridge implementiert generischen RVS-Brain-Proxy: payload {requestId, method, path, body\|bodyBase64, contentType} → ruft Brain-HTTP-API → broadcastet brain_response {requestId, status, json\|text\|base64+contentType}. Damit kann die App beliebige Brain-Endpoints ueber RVS adressieren — nicht nur Memory. App-Service (Phase B): - services/brainApi.ts: Promise-basierter Client. _send() schickt brain_request mit requestId, _ensureListener() filtert die passende brain_response. Methoden: getMemory, listMemories, searchText, searchSemantic, saveMemory, updateMemory, deleteMemory, uploadAttachment (Base64), deleteAttachment, getAttachmentBytes. App-UI (Phasen C+D): - components/MemoryDetailModal.tsx: Modal mit zwei Modi. - Read: Titel, Type, Category, Tags, voller Content, Anhang-Liste (Tap = Bild im Vollbild oder Datei-Info), Stift-Icon → Edit. - Edit: Titel/Content/Category/Tags/Pinned editierbar, Save via brainApi.updateMemory. - DocumentPicker + RNFS.readFile(base64) → uploadAttachment(...). - Anhang loeschen, kompletter Memory loeschen (mit Alert-confirm). - ChatScreen: TouchableOpacity-Wrapper um die memorySaved-Bubble, Tap setzt memoryDetailId → Modal oeffnet. Hint im Footer "tippen für Details" wenn die Bubble eine ID hat. Etappen 4 (Notizen-Inbox neben Lupe) + 5 (Memory-Editor in App- Settings) folgen — diese nutzen die gleiche MemoryDetailModal- Komponente, sind also schnell aufgesetzt sobald 2+3 verifiziert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 13:26:02 +02:00
duffyduck	6239037fa7	feat(memory): Bubble-Header zeigt jetzt Aktion (angelegt/geaendert/geloescht) Etappe 1 von Stefans App-Memory-UX-Wunsch: Brain agent.py: memory_save Dispatcher pushed jetzt action="created", memory_update Dispatcher pushed action="updated" mit demselben memory_saved-Event-Typ. Bridge reicht das action-Feld im Payload mit durch (in beiden Side-Channel-Pfaden — send_to_core + trigger-fired). App ChatScreen: ChatMessage.memorySaved.action ('created' \| 'updated' \| 'deleted'). Bubble-Header je nach Aktion: - created → "🧠 ARIA hat etwas gemerkt" (gelb) - updated → "🧠 ARIA hat eine Notiz geändert" (gelb) - deleted → "🧠 ARIA hat eine Notiz gelöscht" (rot) Naechste Etappen folgen (Detail-Modal beim Tap, Edit + Anhang-Upload, Notizen-Inbox neben Lupe, Memory-Editor in Settings). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 12:44:05 +02:00
duffyduck	16ebaa652f	feat(brain): memory_search + memory_update Tools — ARIA findet Updates aktiv Bug-Report von Stefan: er hat im Diagnostic den Baujahr-Memory von 1972 auf 1974 geaendert, ARIA wusste das nicht und beharrte auf 1972 (weil ihr letzter Conversation-Turn noch '1972' enthielt). Sie konnte auch nicht nachpruefen, sagte selbst: "Qdrant kann ich nicht aktiv durchsuchen". Fix: zwei neue Meta-Tools im agent.py. memory_search(query, mode='text'\|'semantic', k=5): - Volltext oder semantic via store.search_text / store.search - Liefert Liste mit Titel, ID, Content, Anhaengen - Tool-Description sagt explizit: "Memory ist Truth ueber dem Conversation-Window" — wenn beide unterschiedlich sind, gilt Memory. Plus Anker-Anwendungsfaelle: 'schau in deinem Gedaechtnis', 'ich hab das aktualisiert', 'pruef ob's schon was zum Thema gibt' memory_update(id, title?, content?, category?, tags?, pinned?): - Patch existierender Memory per ID (aus memory_search oder Cold-Memory) - Content-Change triggert Re-Embedding fuer Search, sonst nur Payload-Update - Pushed memory_saved-Event analog zu memory_save (App/Diagnostic refreshen) - Tool-Description empfiehlt explizit Update statt neuem Save bei Korrekturen/Ergaenzungen — vermeidet Fragmentierung Damit kann Stefan jetzt sagen "schau in deinem Gedaechtnis" und ARIA findet den aktualisierten Eintrag. Plus bei spaeteren Korrekturen ("ach nee, 1974") nutzt ARIA memory_update statt memory_save + hinterlaesst einen sauberen Eintrag. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-13 03:23:08 +02:00
duffyduck	31a1370050	feat(brain): memory_save mit attach_paths — ARIA haengt Bilder selbst an Letzter Baustein vor Stefan's End-to-End-Test: memory_attachments.attach_from_path(memory_id, src_path): - Kopiert eine bestehende Datei aus /shared/uploads/ oder /shared/memory-attachments/ in das Anhang-Verzeichnis der Memory - Pfadschutz: nur ALLOWED_SOURCE_PREFIXES (/shared/uploads/, /shared/memory-attachments/) — kein Zugriff auf Root-FS oder SSH-Keys - Groessen-Limit wie save_attachment (20 MB Default) agent.py memory_save: - Neuer optionaler Parameter `attach_paths: List[str]` - Nach dem upsert: pro Pfad attach_from_path → Payload update mit neuen Anhang-Metadaten - Fehler beim Anhang sind nicht fatal (Memory bleibt gespeichert, Hinweis in der Tool-Response) - Tool-Description deutlich erweitert: expliziter Workflow-Hinweis bei Bildern → erst `Read <pfad>` aufrufen (Claude Code Read ist multi-modal), Texte/Kennungen/Marken in den content extrahieren, dann erst memory_save mit attach_paths. Beispiel-Workflow als Pseudocode mit Cessna 172 / Kennung D-EAAA. End-to-End-Workflow ist jetzt einarmig moeglich: User: "Ich hab eine Cessna 172" + Bild im Attachment ARIA: Read /shared/uploads/aria_xy.jpg → sieht "Kennung D-EAAA" ARIA: memory_save(content="Stefan besitzt eine Cessna 172, Kennung D-EAAA, weiss/rot lackiert.", attach_paths=["/shared/uploads/aria_xy.jpg"]) → 🧠-Bubble mit Anhang in der App → Spaetere Frage "welche Kennung hat mein Flieger?" liefert via Cold-Memory den Eintrag inkl. Kennung aus dem content Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-13 02:57:02 +02:00
duffyduck	933dd50367	feat(brain): Stufe E — ARIA sieht Bilder ueber Claude Codes Read-Tool Wir mussten den Proxy nicht patchen. Claude Code's eingebautes Read-Tool ist multi-modal-faehig — uebergibt man eine Bilddatei, geht die durch das gleiche Vision-Modell wie via Anthropic-Vision-API. ARIA hat eh "Tool-Freigaben — Vollzugriff" pinned (inkl. Read), also muss sie nur wissen dass sie das nutzen darf. prompts._attachments_line erweitert: bei image/* im Anhang haengen wir den Hinweis an "Bilder kannst du via `Read <pfad>` direkt ansehen". ARIA ruft dann selbststaendig Read mit dem Memory-Anhang-Pfad, sieht das Bild und kann antworten was drauf ist. Heisst: Stefan sagt "schau dir mein Cessna-Foto an" → ARIA findet Memory via Cold-Search → sieht die Read-Anweisung → ruft Read auf → Vision-Modell beschreibt das Bild → ARIA antwortet im Chat. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-13 02:49:09 +02:00
duffyduck	d5531521fa	feat(memory): Anhaenge in App-Bubble + System-Prompt (Stufe C + D) Stufe C — App: - ChatMessage.memorySaved.attachments [{name, mime, size, path, localUri}] - memory_saved-Listener uebernimmt payload.attachments - renderMessage memorySaved-Bubble zeigt Anhaenge als Tap-Reihen (Icon 🖼/📄 + Filename + Hint). Tap → file_request via Bridge, beim ersten Mal "(tippen zum Laden)" → nach file_response cached + bei Bildern setFullscreenImage, bei anderen openFileWithIntent - file_response-Handler updated zusaetzlich memorySaved.attachments per serverPath-Match - Styles fuer memoryAttachmentRow/Icon/Name/Meta Stufe D — System-Prompt: - prompts._attachments_line: pro Memory eine Zeile "📎 Anhaenge: foo.jpg (image/jpeg, 109 KB) — Pfad: /shared/memory-attachments/<id>/" - Wird in build_hot_memory_section + build_cold_memory_section nach dem Content angehangen - ARIA "weiss" damit dass Anhaenge da sind und kann via Bash darauf zugreifen (file, head, base64 …). Echt sehen kann sie sie erst mit Multi-Modal-Pipeline (Stufe E) - memory_save Dispatcher: attachments-Liste auch im memory_saved-Event (vermutlich [] beim Save, aber konsistent fuer spaeteres Speichern-mit-Anhaengen-Pattern) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-13 02:45:51 +02:00
duffyduck	da4e970a31	feat(brain): Memory-Anhaenge — multipart/form-data Endpoint daneben Base64 Stefan's Test scheiterte: ein normales Handy-Foto als Base64 in der curl-d-Argumentliste sprengt Bash's ARG_MAX (typisch 128KB-2MB). Plus: Browser-FormData und curl -F sind eh der Standard fuer File-Uploads. Fix: zusaetzlicher Endpoint POST /memory/{id}/attachments/upload (multipart/form-data, field: file) Beispiel auf der VM: curl -F file=@/pfad/zu/foto.jpg \ "$ARIA_BRAIN_URL/memory/<id>/attachments/upload" \| jq Base64-Endpoint (/memory/{id}/attachments) bleibt fuer kleine Uploads + interne JSON-Tools. Beide rufen am Ende den gleichen _commit_attachment_meta-Helper, der das Memory-Payload um den neuen Anhang updated. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-13 02:32:24 +02:00
duffyduck	c677cfed24	feat(brain): Anhaenge an Memory-Eintraege (Stufe A — Backend) Pro Memory koennen jetzt Dateien (Bilder, PDFs, Sound, ...) angehaengt werden. Use-Case: Stefan sagt "ich hab eine Cessna 172" und pinnt gleich ein Foto dran — ARIA sieht spaeter neben dem Memory auch die visuelle Referenz (Stufe E = Multi-Modal-Pipeline). Stufe A baut nur den Backend-Layer; UI kommt in Stufe B (Diagnostic) und C (App). Anhaenge werden in Stufe A nur via HTTP-API gepflegt (curl), ARIA selbst kann sie noch nicht hochladen — sinnvoll erst wenn die Vision-Pipeline (Stufe E) steht. Komponenten: - memory_attachments.py: neuer Storage-Helper. Layout /shared/memory-attachments/<memory-id>/<safe-filename>. Filename-Sanitization (kein Path-Traversal), Limit 20 MB konfigurierbar, save/list/delete/read_bytes + delete_all fuer Cleanup beim Memory-Delete. - vector_store.py: MemoryPoint.attachments (List[dict]) — Metadaten {name, mime, size, path} im Qdrant-Payload damit Suche/Anzeige sie ohne Filesystem-Lookup kennt. - main.py: - MemoryIn akzeptiert attachments-Liste (fuer Restore-Faelle) - MemoryOut liefert attachments - GET /memory/{id}/attachments → Liste vom FS - POST /memory/{id}/attachments → Base64-Upload, schreibt FS + updated Payload-Liste - DELETE /memory/{id}/attachments/{filename} → FS + Payload-Eintrag weg - GET /memory/{id}/attachments/{filename} → Bytes mit MIME serve - /memory/delete cleanup: ruft attachments.delete_all damit kein Verzeichnis verwaist Smoke-Test nach Brain-Rebuild (Stefan auf VM): # Memory-ID rauspicken ID=$(curl -s "$ARIA_BRAIN_URL/memory/list?type=fact" \| python3 -c "import sys,json;print(json.load(sys.stdin)[0]['id'])") # Bild als Base64 hochladen B64=$(base64 -w0 /pfad/zu/foto.jpg) curl -s -X POST "$ARIA_BRAIN_URL/memory/$ID/attachments" \ -H 'Content-Type: application/json' \ -d "{\"name\":\"foto.jpg\",\"data_base64\":\"$B64\"}" \| jq # Liste anzeigen curl -s "$ARIA_BRAIN_URL/memory/$ID/attachments" \| jq # Datei wieder laden curl -s "$ARIA_BRAIN_URL/memory/$ID/attachments/foto.jpg" -o /tmp/back.jpg Stufe B (Diagnostic-UI) folgt sobald A getestet ist. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-13 02:27:02 +02:00
duffyduck	1e754910ee	fix(brain): Cold Memory mit Score-Threshold — kein Crosstalk mehr Bug: Agent.chat() rief store.search() OHNE score_threshold — die Top-5 wurden ungefiltert in den 'Moeglicherweise relevant'-Block des System-Prompts gepackt. Bei kleiner DB hatte das absurde Folgen: Stefan fragte 'hab ich ein flugzeug?', Cold-Search lieferte Top-1 'Watcher-Latenzproblem' mit Score 0.138 + 'Firmenadresse' mit 0.094, ARIA wob die Firmenadresse in die Antwort ein ('Die Adresse habe ich aus meinem Gedaechtnis...') — obwohl der User gar nicht danach gefragt hat. Fix: Konstante COLD_SCORE_THRESHOLD=0.30 in Agent eingefuehrt und an store.search() durchgereicht. Treffer unter 0.30 werden als Rauschen verworfen, ARIA bekommt nur substantielle Memories ins Cold-Set. Konsistent mit dem Threshold im /memory/search HTTP-Endpoint und dem Diagnostic UI. MiniLM-multilingual gibt fuer unverwandte deutsche Texte gerne 0.10- 0.25 Score — alles darunter ist Embedder-Noise, kein echter Bezug. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-13 02:13:32 +02:00
duffyduck	df60bb6d74	fix(brain): Cessna-Beispiel aus System-Prompt raus — keine Phantom-Wissens-Hinweise ARIA hatte beim 'weisst du ob ich ein Flugzeug habe?'-Test richtig geantwortet ('nein'), aber transparent erklaert dass sie das Wort 'Cessna' aus dem memory_save Tool-Description kennt — wo es als Beispiel fuer den fact-Type stand. Ein Beispiel-Text der jedes Chat-Turn im System-Prompt landet ist suboptimal, auch wenn ARIA ihn korrekt einordnet. Fix: das konkrete Beispiel durch eine generische Aufzaehlung ersetzt (Vorlieben/Besitz/Orte/Termine/Personen). Ohne Stefan- spezifisches Phantom-Wissen. Selber Spirit in der search-text Docstring im main.py (geht zwar nicht in den Prompt, aber lieber konsistent). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-13 01:39:54 +02:00
duffyduck	5f96ace469	feat(brain): memory_save Tool — ARIA schreibt selber in die Qdrant-DB ARIA hatte bisher KEIN Tool um eigene Notizen sauber zu persistieren — sie ist deshalb aufs Claude-Code-File-Memory ausgewichen (das wir mit dem letzten Commit per tmpfs abgeklemmt haben). Jetzt schliesst sich der Loop: ein echtes memory_save-Tool gegen die Qdrant-DB. Brain: - agent.py: memory_save als Meta-Tool mit Schema (title, content, type, optional category/tags/pinned). Tool-Description erklaert die Type-Wahl (identity/rule/preference/tool/skill = pinned, fact/conversation/reminder = cold) und sagt explizit: "Du hast KEIN File-Memory mehr, schreibe nicht in ~/.claude/projects/..." - Dispatcher: validiert type-enum, ruft self.embedder.embed + self.store.upsert, pushed memory_saved als _pending_events damit Bridge eine Bubble broadcasten kann. Side-Channel-Pipeline (gleich wie skill_created/trigger_created): - Bridge send_to_core + _handle_trigger_fired: forwarden memory_saved als RVS-Event - rvs/server.js: ALLOWED_TYPES += memory_saved - diagnostic/server.js: relayed memory_saved von RVS an Browser - diagnostic UI: addMemorySavedBubble (gelber Border) + Auto-Refresh des Gehirn-Tabs wenn aktiv - android: ChatMessage.memorySaved-Feld, Listener fuer memory_saved, renderMessage-Spezialbubble, History-Replace-Schutz (lokal-only) Damit ist die Architektur konsistent: "merk dir X" → ARIA ruft memory_save → Eintrag in Qdrant → Diagnostic-Gehirn-Tab zeigt's sofort → bei naechstem Turn liefert Cold Memory (Semantic Search) das Wissen wieder rein. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-13 01:27:20 +02:00
duffyduck	6549fcbce8	feat(brain): Volltext-Suche zusaetzlich zu Semantic — Default ist jetzt Wortlich Stefan wollte ne richtige Suche statt nur "klingt aehnlich". Beide Modi sind jetzt verfuegbar, Default ist Volltext: - 📝 Wortlich (Substring, case-insensitive ueber Title + Content + Category + Tags) — neuer Endpoint /memory/search-text. Full-Scan via Qdrant scroll, k=50. Findet "cessna" exakt im Content. Bei kleiner DB (<1000 Eintraege) unkritisch performant. - 🧠 Semantisch (Embedder + score_threshold 0.30) — bestehender /memory/search Endpoint. Findet konzeptuell verwandte Eintraege. Diagnostic UI: Dropdown neben dem Suchfeld zum Modus-Wechsel. Info-Banner zeigt klar welcher Modus aktiv ist. Warum Wortlich Default: bei kleiner DB liefert Semantic gern False Positives mit Score 0.30-0.45 fuer komplett unverwandte Begriffe (z.B. "cessna" matched "Tageslog fuehren" mit 0.43). Wortlich ist deterministisch und vermeidet das Rauschen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-12 16:59:31 +02:00
duffyduck	3f2499b528	feat(chat): Muelltonne pro Bubble — gezielt eine Nachricht loeschen Stefan kann jetzt einzelne Chat-Bubbles loeschen (mit Rueckfrage). Die Bubble verschwindet aus chat_backup.jsonl (Bridge), Brain- Conversation (rolling window + jsonl) und allen Clients (App + Diagnostic). Genauso wichtig fuer ARIA: der gloeschte Turn ist im naechsten Chat-Prompt nicht mehr im Window. Pipeline: UI 🗑 + confirm → RVS delete_message_request {ts} → Bridge._delete_chat_message: - chat_backup.jsonl Zeile mit ts entfernen (atomar via tmp+rename) - Brain POST /conversation/delete-turn (role+content match) - RVS broadcast chat_message_deleted {ts} → App + Diagnostic entfernen Bubble lokal per ts-Match Backend-Aenderungen: - aria-brain/conversation.py: remove_by_match(role, content, ts_hint) + _rewrite_file (atomar). Match nahester Turn bei mehrfach gleichem content. - aria-brain/main.py: POST /conversation/delete-turn (POST statt DELETE weil FastAPI keine Bodys auf DELETE erlaubt) - bridge/aria_bridge.py: HTTP-Listener /internal/delete-chat-message + RVS-Handler delete_message_request. _append_chat_backup gibt jetzt ts zurueck, _process_core_response packt backupTs ins chat-Event. - rvs/server.js: ALLOWED_TYPES um delete_message_request + chat_message_deleted erweitert. - diagnostic/server.js: delete_chat_message-Action + chat_message_deleted Relay zum Browser. Frontend-Aenderungen: - diagnostic/index.html: 🗑 erscheint on-hover in Bubbles mit data-ts, confirm()-Dialog, addChat + chat_history setzen data-ts. WS-Listener fuer chat_message_deleted entfernt Bubble per data-ts. - android/ChatScreen.tsx: backupTs in ChatMessage, Muelltonne-Button unten rechts in jeder Bubble, Alert-confirm, RVS-Listener fuer chat_message_deleted entfernt aus messages-State. Live-User-Bubbles (sofort gerendert vom eigenen Send) haben noch keinen backupTs bis der Bridge-Roundtrip durch ist — die Muelltonne erscheint dort erst nach kurzer Verzoegerung / Reload. Folgekommit kann das polieren wenn noetig. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-12 16:42:20 +02:00
duffyduck	daf0d44dd7	fix(brain): Memory-Suche filtert jetzt Rauschen — score_threshold + kleineres k Bug: bei kleiner DB (31 Eintraege) lieferte die Suche fuer JEDES Wort fast alles als Treffer zurueck — k=20 Top-N ohne Threshold sorgte dafuer dass auch "banane" zehn vermeintliche Treffer mit Scores 0.09-0.22 (= Rauschen) zurueckgab. Fix: - vector_store.search() bekommt optional score_threshold (an Qdrant durchgereicht, das nimmt's nativ) - /memory/search endpoint hat score_threshold-Query-Param (default 0.30) - Diagnostic schickt k=10 + score_threshold=0.30 statt k=20 ohne Threshold - "Keine Treffer"-Info-Box wenn alle Treffer < Threshold MiniLM-multilingual liefert typischerweise: >0.50 → starker Treffer 0.30-0.50 → relevant 0.20-0.30 → grenzwertig <0.20 → Rauschen Mit score_threshold=0 (oder None) bleibt die alte Top-N-Semantik fuer Aufrufer die Rauschen explizit wollen. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-12 15:59:05 +02:00
duffyduck	7237f05344	fix(trigger): Trigger-Antworten landen jetzt im Chat — Brain → Bridge Push Bug: Wenn der Brain-Background-Loop einen Timer/Watcher feuert, ruft er agent.chat() direkt im eigenen Prozess. Die Antwort wurde nur ins Trigger-Log geschrieben — kein RVS-Broadcast, kein TTS, nichts in App/Diagnostic sichtbar. Fix: Bridge ↔ Brain bekommen einen internen HTTP-Push-Kanal. Bridge (Port 8090, nicht exposed, nur aria-net intern): asyncio.start_server-basierter HTTP-Listener. POST /internal/trigger-fired body: {reply, trigger_name, type, events} → _handle_trigger_fired feuert Side-Channel-Events (trigger_created/skill_created/location_tracking) erst, dann _process_core_response(reply) — exakt der gleiche Pfad wie normale Chat-Antworten (Chat-Bubble + TTS + chat_backup). Brain background.py: Nach agent.chat() in _fire wird agent.pop_events() ausgelesen und zusammen mit dem Reply via urllib an aria-bridge:8090 gepostet (run_in_executor damit es den asyncio-Loop nicht blockiert). Failures werden geloggt, der Trigger selbst bleibt trotzdem als 'fired' markiert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-12 01:50:32 +02:00

1 2

58 Commits