feat(flux): HF-Token in Diagnostic statt .env

Passwort-Feld in der FLUX-Section, mit Show/Hide-Toggle und kurzem
Hinweis-Link zu den HuggingFace-Schritten (Lizenz-Agree + Token-Erzeugung).
Wert wird in voice_config.json persistiert und per config-Broadcast an
die flux-bridge gepusht; dort vor jedem from_pretrained als HF_TOKEN +
HUGGING_FACE_HUB_TOKEN env gesetzt.

HF_TOKEN aus .env.example + docker-compose.yml entfernt. Auch FLUX_MODEL
aus compose raus — Default-Modell kommt jetzt komplett aus Diagnostic.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
2026-05-16 23:25:55 +02:00
parent 0407c5bc3c
commit afa96b1d44
6 changed files with 54 additions and 28 deletions
+7 -14
View File
@@ -10,23 +10,16 @@ RVS_TLS=true
RVS_TLS_FALLBACK=true
RVS_TOKEN=dein_token_hier
# HuggingFace-Token — NUR noetig wenn Du FLUX.1-dev nutzen willst.
# FLUX.1-dev ist auf HuggingFace 'gated' (= Du musst dort auf der
# Modell-Seite einmalig "Agree" klicken und beim Download wird Dein
# Login geprueft). Reine Lizenz-Sache — die Inference laeuft danach
# komplett lokal, kein Netz, keine Telemetrie.
# HuggingFace-Token + Default-Modell werden in ARIA Diagnostic verwaltet
# (Section "FLUX Bildgenerierung") und per RVS an die flux-bridge gepusht.
# Hier nichts noetig.
#
# Wenn Du nur FLUX.1-schnell nutzt (Apache-2.0, kein Gate), kannst Du
# das Feld leer lassen. Falls Du spaeter dev aktivierst:
# Token-Pflicht NUR fuer FLUX.1-dev (gated). Workflow falls Du dev nutzen
# willst:
# 1) https://huggingface.co/black-forest-labs/FLUX.1-dev → "Agree"
# 2) https://huggingface.co/settings/tokens → "Read"-Token erzeugen
# 3) Hier eintragen + docker compose restart flux-bridge
HF_TOKEN=
# Welches Modell beim Startup geladen wird, steuert ARIA selbst:
# Diagnostic > FLUX > Default-Modell. Solange dort nichts gewaehlt ist,
# laedt die flux-bridge erstmal nichts — sie wartet auf den ersten
# Render-Request oder einen Diagnostic-config-Broadcast.
# 3) Token in Diagnostic > FLUX Bildgenerierung > HuggingFace-Token
# FLUX.1-schnell (Apache-2.0) laeuft ohne Token.
# Offloading-Strategie (VRAM-Steuerung):
# model — Default. Komponentenweise CPU-Offload, gut fuer 12 GB Karten.