# ════════════════════════════════════════════════ # ARIA FLUX-Bridge — Konfiguration # Kopieren nach .env und anpassen # ════════════════════════════════════════════════ # RVS Verbindung (gleiche Daten wie auf der ARIA-VM / xtts/.env) RVS_HOST=mobil.hacker-net.de RVS_PORT=444 RVS_TLS=true RVS_TLS_FALLBACK=true RVS_TOKEN=dein_token_hier # HuggingFace-Token — NUR noetig wenn Du FLUX.1-dev nutzen willst. # FLUX.1-dev ist auf HuggingFace 'gated' (= Du musst dort auf der # Modell-Seite einmalig "Agree" klicken und beim Download wird Dein # Login geprueft). Reine Lizenz-Sache — die Inference laeuft danach # komplett lokal, kein Netz, keine Telemetrie. # # Wenn Du nur FLUX.1-schnell nutzt (Apache-2.0, kein Gate), kannst Du # das Feld leer lassen. Falls Du spaeter dev aktivierst: # 1) https://huggingface.co/black-forest-labs/FLUX.1-dev → "Agree" # 2) https://huggingface.co/settings/tokens → "Read"-Token erzeugen # 3) Hier eintragen + docker compose restart flux-bridge HF_TOKEN= # Welches Modell beim Startup geladen wird, steuert ARIA selbst: # Diagnostic > FLUX > Default-Modell. Solange dort nichts gewaehlt ist, # laedt die flux-bridge erstmal nichts — sie wartet auf den ersten # Render-Request oder einen Diagnostic-config-Broadcast. # Offloading-Strategie (VRAM-Steuerung): # model — Default. Komponentenweise CPU-Offload, gut fuer 12 GB Karten. # sequential — sparsamer (Peak ~6 GB), aber 2-3x langsamer. # none — alles auf GPU. Nur fuer >= 24 GB VRAM-Karten. FLUX_OFFLOAD=model # Float-Type. bfloat16 ist FLUX-native; auf alten Karten ohne BF16-Support # auf float16 wechseln. FLUX_DTYPE=bfloat16 # Hard-Caps gegen versehentlich teure Renders FLUX_MAX_STEPS=50 FLUX_MAX_DIM=1536