feat(brain+diagnostic): Token/Call-Metrics mit Subscription-Plan-Tracking

Stefan hat den Max 5x Plan (~\$90-100/Monat), ungefaehres Limit 225 Calls pro 5h-Fenster fuer Sonnet. Damit nicht in eine Tool-Loop-Schleife laufen ohne es zu merken: kleine Metrics-Pipeline, sichtbar in der Diagnostic. aria-brain/metrics.py Append-only JSONL Logger unter /data/metrics.jsonl. Pro Claude-Call eine Zeile {ts, model, in, out} mit Token-Schaetzung (chars/4, Anthropic- Heuristik). aggregate(window) zaehlt die letzten N Sekunden. Auto-Rotate bei 50k Zeilen → 25k behalten (~70 KB/Monat bei 1k Calls/Tag, Cap also weit oben). aria-brain/proxy_client.py chat_full() ruft am Ende metrics.log_call(model, messages_in, reply). Failed/exception-Pfade loggen nicht (sonst false positives). aria-brain/main.py GET /metrics/calls → {h1, h5, h24, d30}, jedes Window mit calls, tokens_in, tokens_out, by_model. diagnostic/index.html Neue Card "Token / Calls" im Gehirn-Tab. Plan-Dropdown (Pro / Max 5x / Max 20x / Custom), localStorage-persistiert. 4 Metric- Zellen fuer 1h/5h/24h/30d mit Calls + Tokens. Progress-Bar oben zeigt 5h-Counter gegen Plan-Limit. Warn-Klassen: gelb bei 80%, rot bei 90%. Auto-Refresh alle 30s wenn Gehirn-Tab offen, plus bei Tab-Wechsel. Info-Modal erklaert die Limits + dass HTTP-Call != User-Frage (Tool-Use kann pro Frage bis zu 8 Calls verursachen). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-11 23:43:56 +02:00
parent eeedcc4781
commit b2f7d6dda2
4 changed files with 331 additions and 0 deletions
@@ -29,6 +29,7 @@ from conversation import Conversation
 from proxy_client import ProxyClient
 from agent import Agent
 import skills as skills_mod
+import metrics as metrics_mod

 logging.basicConfig(level=logging.INFO, format="%(asctime)s [%(levelname)s] %(name)s: %(message)s")
 logger = logging.getLogger("aria-brain")
@@ -404,6 +405,15 @@ def conversation_distill_now():
    return agent().distill_old_turns()


+# ─── Call-Metrics (Token / Quota-Monitoring) ────────────────────────
+
+@app.get("/metrics/calls")
+def metrics_calls():
+    """Liefert Aggregate fuer 1h / 5h / 24h / 30d.
+    Jedes Window: {window_seconds, calls, tokens_in, tokens_out, by_model}."""
+    return metrics_mod.stats()
+
+
 # ─── Skills ─────────────────────────────────────────────────────────

 class SkillCreate(BaseModel):