ARIA-AGENT

Author	SHA1	Message	Date
duffyduck	1ea7ab5ab1	fix(brain): run_<skill> Tool-Namen safe escapen — Bindestriche kippten Tools-Liste Beobachtung beim zweiten Live-Test (01:13:41): ARIA versuchte echten Tool-Call `run_spotify` — bekam aber Error: 'No such tool available'. Ursache: _skill_to_tool baute Tool-Namen via `run_{s['name']}`. Bei Skills wie 'yt-dlp-download' wurde daraus 'run_yt-dlp-download' mit Bindestrich. Anthropic-Tool-Name-Schema ist eigentlich [a-zA-Z0-9_-], ABER der claude-max-api-proxy konvertiert intern auf OpenAI-Format und faellt bei Bindestrichen um — wenn EIN Tool ungueltig ist, kippt die GANZE Tool-Liste, ARIA sieht nichts von 'run_*' inklusive 'run_spotify' obwohl der ja Bindestrich-frei war. Fix: - _skill_to_tool: name = "run_" + re.sub(r"[^a-zA-Z0-9_]", "_", s["name"]) → run_yt_dlp_download statt run_yt-dlp-download. - Dispatcher: bei tool_name='run_X' wird zuerst X als skill_name probiert, bei Miss wird ueber die Liste der existierenden Skills gemappt — der Skill mit safe_name(name)==X wird dann genommen. - Bypass-Lesson + Bypass-Section: gleiche safe-Logik fuer den empfohlenen run_<tool>-String im Memory/Prompt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 01:17:48 +02:00
duffyduck	210ce62ffe	feat(brain): Skill-Bypass-Detection + Bypass-Lehre als pinned Memory Variante 3+ (Lerneffekt-Variante): Variante C scaffolded zwar Skills auto, aber ARIA lernt nicht — sie wird beim naechsten Mal trotzdem zu Bash greifen. Stefans Punkt: Lernen geht nur ueber Brain-Memory. Mechanik: 1. api_heuristic.detect_recent_bypass(skills, since_sec=600): schaut letzte 10 Min im agent_stream.jsonl, findet Bash-curl gegen Hosts fuer die bereits ein matching Skill existiert. Returnt {host, skill_name, count, last_ts}. 2. api_heuristic.build_bypass_section(events): Drastischer Markdown-Block "## 🚨 SKILL-BYPASS ERKANNT" mit konkretem run_<skill>-Hint pro betroffenem Host. Landet direkt im System-Prompt noch VOR dem normalen API-Heuristik-Block. 3. agent.py._upsert_bypass_lesson(ev): Schreibt eine pinned type=rule Memory mit source=auto-feedback und migration_key=auto/skill-bypass/<skill_name>. Idempotent: bei Wiederholung wird die alte Memory ueberschrieben (Counter aktualisiert), keine Karteileichen. Content nennt konkret den run-Tool-Namen und Performance-Vergleich (3s Tool-Call vs 13-20s Bash-Wrapper). Diese Memory ist permanent pinned → kommt bei jedem Chat-Turn, cross-session, cross-restart als Hot-Memory durch. Damit lernt ARIA es im wortlichen Sinne, nicht nur Reibung in der aktuellen Konversation. Idempotenz wichtig: bei jedem Bypass-Detection-Lauf wird die Memory upgedatet (nicht dupliziert). Stefan kann sie via Diagnostic-Gehirn-Tab loeschen falls sie nervt. Stefan-Frage beantwortet: 'sie wuerde es aber nur lernen wenn sie es auch im gehirn speichert oder?' — exakt. Schimpfen im Prompt ist Reibung dieser Session, pinned Memory ist permanenter Lerneffekt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 00:37:40 +02:00
duffyduck	298b2202a1	feat(brain): Auto-Scaffold — Brain legt Skills selbst an wenn ARIA driftet Variante C: ARIA hat selbst mit Heuristik-Block + 11 seed_rules den expliziten skill_scaffold-Befehl ignoriert (32x Spotify-Bash-Calls in 24h, kein einziger scaffold-Aufruf). Verhaltens-Traegheit ist staerker als jeder Prompt-Hint. Loesung: Brain wartet nicht mehr. Bei jedem chat()-Aufruf wird die Heuristik berechnet. Findet sie einen Host mit bekannter Suggestion (Spotify, GitHub, OpenAI, OpenWeather, Telegram, Microsoft, Discord, Notion, Reddit) der noch keinen Skill hat → Brain ruft selbst `scaffold_skill(name, template, params)` mit author='aria-auto'. Der frische Skill ist sofort im Prompt sichtbar (Skill-Liste wird nach Scaffold refreshed, Heuristik-Cache invalidiert, Hints neu gerechnet). Side-Channel-Event 'skill_created' mit Flag 'auto_scaffolded' geht an die UI — Stefan sieht im Chat dass Brain einen Skill angelegt hat. ARIA findet beim Tool-Use-Loop einen passenden `run_<name>`-Skill vor und nutzt ihn idealerweise statt wieder Bash. Macht sie's nicht und curlt trotzdem weiter, ist der Counter beim naechsten Mal wieder hoch und Brain scaffolded weiter — aber dann ist der Skill ja schon da, also nur ein Pfad. Toggle: BRAIN_AUTO_SCAFFOLD=false zum Abschalten. scaffold-reflex Regel angepasst: ARIA wird informiert dass Brain manchmal selbst scaffolded (author=aria-auto) und sie den Skill via run_<name> nutzen soll statt zu curlen. Bei Hinweisen OHNE Suggestion (unbekannter Host) soll sie selbst skill_scaffold rufen. Stefan-Zitat aus der Diskussion ("ARIA lernt es so nicht"): stimmt inhaltlich, aber pragmatisch wichtiger ist dass Stefans Wartezeit von 20s auf 3s sinkt. Lernen kann sie spaeter — der Skill ist da, sie sieht den Pfad jedes Mal beim Tool-Listing. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 00:28:15 +02:00
duffyduck	845a8b0020	feat(brain): API-Heuristik — Cross-Session-Counter fuer Skill-Drift Variante B: scaffold-reflex Regel allein reicht nicht weil jede Chat- Anfrage eine eigene claude-CLI-Session ist. ARIA sieht in der aktuellen Session nicht dass sie gestern auch schon 10x dieselbe API gecurled hat. Beobachtung: 5+ Spotify-Bash-Calls hintereinander, kein Skill angelegt. Loesung: Brain trackt server-side aus dem persistierten agent_stream.jsonl. Bei jedem chat() wird der Log gescanned (cache 5min), Bash-curl-Calls nach Hostname aggregiert. Hosts mit >=3 Calls in 24h ohne passenden Skill landen als '## API-Heuristik'-Block im System-Prompt mit konkretem skill_scaffold-Vorschlag. Neue Module: - aria-brain/api_heuristic.py: - compute_hints(existing_skills, force): Aggregiert + filtert - build_section(hints): formatiert als kompakten Markdown-Block - Smart suggestions mapping (api.spotify.com → oauth-api template etc.) - Ignoriert interne Hosts (aria-brain, localhost, docker-bridge) - 5-min Cache damit nicht jeder Turn die JSONL parst - aria-brain/prompts.py: build_system_prompt nimmt api_heuristic_section als optionalen Block direkt nach Skills-Section. - aria-brain/agent.py: vor build_system_prompt Heuristik berechnen mit aktueller Skill-Liste, Block durchreichen. - 11. seed_rule scaffold-reflex umgeschrieben: kein 'in einer Session' mehr (das ergab keinen Sinn — jeder Turn neue Session). Stattdessen: '## API-Heuristik'-Block ist Dein Cross-Session-Gedaechtnis. Wenn da was steht: scaffolden BEVOR Du Bash machst. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-30 00:19:06 +02:00

4 Commits