feat(flux): Modell-Wahl per Diagnostic + raw/switch-Keywords + Download-Hinweis

Diagnostic-Einstellungen fuer FLUX:
- Default-Modell (dev | schnell) — wird via RVS gepusht, flux-bridge
  hot-swappt die Pipeline aus dem HF-Cache (~15-30s)
- Raw-Keyword (Default 'flux') — Pipe-Modus, Brain leitet Stefans Text
  1:1 als prompt durch, kein Rewriting/Beautify
- Switch-Keyword (Default 'fix') — zwingt das ANDERE Modell als Default

Brain-Tool flux_generate um model + raw erweitert, System-Prompt-Block
mit den aktuellen Diagnostic-Settings + Whisper-Toleranz-Hinweis.

Kein eager Bootstrap-Load: flux-bridge wartet auf config oder ersten
Request. Bei erstem HF-Download zeigt Banner "laedt erstmalig runter"
mit Pfeil-Icon, Toast in der App wenn fertig.

FLUX_MODEL aus der .env entfernt (Steuerung jetzt komplett ueber
Diagnostic). HF_TOKEN-Kommentar erklaert warum trotz lokaler Inference
noetig (HF Gate-Mechanismus fuer FLUX.1-dev).

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
2026-05-16 23:11:22 +02:00
parent 7e53dcfed3
commit 2d348aeec7
8 changed files with 440 additions and 72 deletions
+15 -8
View File
@@ -10,16 +10,23 @@ RVS_TLS=true
RVS_TLS_FALLBACK=true
RVS_TOKEN=dein_token_hier
# HuggingFace-Token — FLUX.1-dev ist gated (auf
# https://huggingface.co/black-forest-labs/FLUX.1-dev "Agree" klicken,
# dann unter https://huggingface.co/settings/tokens ein "Read"-Token
# erzeugen). Fuer FLUX.1-schnell nicht noetig.
# HuggingFace-Token — NUR noetig wenn Du FLUX.1-dev nutzen willst.
# FLUX.1-dev ist auf HuggingFace 'gated' (= Du musst dort auf der
# Modell-Seite einmalig "Agree" klicken und beim Download wird Dein
# Login geprueft). Reine Lizenz-Sache — die Inference laeuft danach
# komplett lokal, kein Netz, keine Telemetrie.
#
# Wenn Du nur FLUX.1-schnell nutzt (Apache-2.0, kein Gate), kannst Du
# das Feld leer lassen. Falls Du spaeter dev aktivierst:
# 1) https://huggingface.co/black-forest-labs/FLUX.1-dev → "Agree"
# 2) https://huggingface.co/settings/tokens → "Read"-Token erzeugen
# 3) Hier eintragen + docker compose restart flux-bridge
HF_TOKEN=
# Modell:
# black-forest-labs/FLUX.1-dev (Default, ~24 GB, non-commercial)
# black-forest-labs/FLUX.1-schnell (4 Steps, Apache-2.0, schneller)
FLUX_MODEL=black-forest-labs/FLUX.1-dev
# Welches Modell beim Startup geladen wird, steuert ARIA selbst:
# Diagnostic > FLUX > Default-Modell. Solange dort nichts gewaehlt ist,
# laedt die flux-bridge erstmal nichts — sie wartet auf den ersten
# Render-Request oder einen Diagnostic-config-Broadcast.
# Offloading-Strategie (VRAM-Steuerung):
# model — Default. Komponentenweise CPU-Offload, gut fuer 12 GB Karten.