feat(flux): Modell-Wahl per Diagnostic + raw/switch-Keywords + Download-Hinweis

Diagnostic-Einstellungen fuer FLUX: - Default-Modell (dev | schnell) — wird via RVS gepusht, flux-bridge hot-swappt die Pipeline aus dem HF-Cache (~15-30s) - Raw-Keyword (Default 'flux') — Pipe-Modus, Brain leitet Stefans Text 1:1 als prompt durch, kein Rewriting/Beautify - Switch-Keyword (Default 'fix') — zwingt das ANDERE Modell als Default Brain-Tool flux_generate um model + raw erweitert, System-Prompt-Block mit den aktuellen Diagnostic-Settings + Whisper-Toleranz-Hinweis. Kein eager Bootstrap-Load: flux-bridge wartet auf config oder ersten Request. Bei erstem HF-Download zeigt Banner "laedt erstmalig runter" mit Pfeil-Icon, Toast in der App wenn fertig. FLUX_MODEL aus der .env entfernt (Steuerung jetzt komplett ueber Diagnostic). HF_TOKEN-Kommentar erklaert warum trotz lokaler Inference noetig (HF Gate-Mechanismus fuer FLUX.1-dev). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-16 23:11:22 +02:00
parent 7e53dcfed3
commit 2d348aeec7
8 changed files with 440 additions and 72 deletions
@@ -10,16 +10,23 @@ RVS_TLS=true
 RVS_TLS_FALLBACK=true
 RVS_TOKEN=dein_token_hier

-# HuggingFace-Token — FLUX.1-dev ist gated (auf
-# https://huggingface.co/black-forest-labs/FLUX.1-dev "Agree" klicken,
-# dann unter https://huggingface.co/settings/tokens ein "Read"-Token
-# erzeugen). Fuer FLUX.1-schnell nicht noetig.
+# HuggingFace-Token — NUR noetig wenn Du FLUX.1-dev nutzen willst.
+# FLUX.1-dev ist auf HuggingFace 'gated' (= Du musst dort auf der
+# Modell-Seite einmalig "Agree" klicken und beim Download wird Dein
+# Login geprueft). Reine Lizenz-Sache — die Inference laeuft danach
+# komplett lokal, kein Netz, keine Telemetrie.
+#
+# Wenn Du nur FLUX.1-schnell nutzt (Apache-2.0, kein Gate), kannst Du
+# das Feld leer lassen. Falls Du spaeter dev aktivierst:
+#   1) https://huggingface.co/black-forest-labs/FLUX.1-dev → "Agree"
+#   2) https://huggingface.co/settings/tokens → "Read"-Token erzeugen
+#   3) Hier eintragen + docker compose restart flux-bridge
 HF_TOKEN=

-# Modell:
-#   black-forest-labs/FLUX.1-dev      (Default, ~24 GB, non-commercial)
-#   black-forest-labs/FLUX.1-schnell  (4 Steps, Apache-2.0, schneller)
-FLUX_MODEL=black-forest-labs/FLUX.1-dev
+# Welches Modell beim Startup geladen wird, steuert ARIA selbst:
+# Diagnostic > FLUX > Default-Modell. Solange dort nichts gewaehlt ist,
+# laedt die flux-bridge erstmal nichts — sie wartet auf den ersten
+# Render-Request oder einen Diagnostic-config-Broadcast.

 # Offloading-Strategie (VRAM-Steuerung):
 #   model       — Default. Komponentenweise CPU-Offload, gut fuer 12 GB Karten.