# ════════════════════════════════════════════════
#  ARIA FLUX-Bridge — Konfiguration
#  Kopieren nach .env und anpassen
# ════════════════════════════════════════════════

# RVS Verbindung (gleiche Daten wie auf der ARIA-VM / xtts/.env)
RVS_HOST=mobil.hacker-net.de
RVS_PORT=444
RVS_TLS=true
RVS_TLS_FALLBACK=true
RVS_TOKEN=dein_token_hier

# HuggingFace-Token — NUR noetig wenn Du FLUX.1-dev nutzen willst.
# FLUX.1-dev ist auf HuggingFace 'gated' (= Du musst dort auf der
# Modell-Seite einmalig "Agree" klicken und beim Download wird Dein
# Login geprueft). Reine Lizenz-Sache — die Inference laeuft danach
# komplett lokal, kein Netz, keine Telemetrie.
#
# Wenn Du nur FLUX.1-schnell nutzt (Apache-2.0, kein Gate), kannst Du
# das Feld leer lassen. Falls Du spaeter dev aktivierst:
#   1) https://huggingface.co/black-forest-labs/FLUX.1-dev → "Agree"
#   2) https://huggingface.co/settings/tokens → "Read"-Token erzeugen
#   3) Hier eintragen + docker compose restart flux-bridge
HF_TOKEN=

# Welches Modell beim Startup geladen wird, steuert ARIA selbst:
# Diagnostic > FLUX > Default-Modell. Solange dort nichts gewaehlt ist,
# laedt die flux-bridge erstmal nichts — sie wartet auf den ersten
# Render-Request oder einen Diagnostic-config-Broadcast.

# Offloading-Strategie (VRAM-Steuerung):
#   model       — Default. Komponentenweise CPU-Offload, gut fuer 12 GB Karten.
#   sequential  — sparsamer (Peak ~6 GB), aber 2-3x langsamer.
#   none        — alles auf GPU. Nur fuer >= 24 GB VRAM-Karten.
FLUX_OFFLOAD=model

# Float-Type. bfloat16 ist FLUX-native; auf alten Karten ohne BF16-Support
# auf float16 wechseln.
FLUX_DTYPE=bfloat16

# Hard-Caps gegen versehentlich teure Renders
FLUX_MAX_STEPS=50
FLUX_MAX_DIM=1536