2d348aeec7
Diagnostic-Einstellungen fuer FLUX: - Default-Modell (dev | schnell) — wird via RVS gepusht, flux-bridge hot-swappt die Pipeline aus dem HF-Cache (~15-30s) - Raw-Keyword (Default 'flux') — Pipe-Modus, Brain leitet Stefans Text 1:1 als prompt durch, kein Rewriting/Beautify - Switch-Keyword (Default 'fix') — zwingt das ANDERE Modell als Default Brain-Tool flux_generate um model + raw erweitert, System-Prompt-Block mit den aktuellen Diagnostic-Settings + Whisper-Toleranz-Hinweis. Kein eager Bootstrap-Load: flux-bridge wartet auf config oder ersten Request. Bei erstem HF-Download zeigt Banner "laedt erstmalig runter" mit Pfeil-Icon, Toast in der App wenn fertig. FLUX_MODEL aus der .env entfernt (Steuerung jetzt komplett ueber Diagnostic). HF_TOKEN-Kommentar erklaert warum trotz lokaler Inference noetig (HF Gate-Mechanismus fuer FLUX.1-dev). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
44 lines
1.9 KiB
Bash
44 lines
1.9 KiB
Bash
# ════════════════════════════════════════════════
|
|
# ARIA FLUX-Bridge — Konfiguration
|
|
# Kopieren nach .env und anpassen
|
|
# ════════════════════════════════════════════════
|
|
|
|
# RVS Verbindung (gleiche Daten wie auf der ARIA-VM / xtts/.env)
|
|
RVS_HOST=mobil.hacker-net.de
|
|
RVS_PORT=444
|
|
RVS_TLS=true
|
|
RVS_TLS_FALLBACK=true
|
|
RVS_TOKEN=dein_token_hier
|
|
|
|
# HuggingFace-Token — NUR noetig wenn Du FLUX.1-dev nutzen willst.
|
|
# FLUX.1-dev ist auf HuggingFace 'gated' (= Du musst dort auf der
|
|
# Modell-Seite einmalig "Agree" klicken und beim Download wird Dein
|
|
# Login geprueft). Reine Lizenz-Sache — die Inference laeuft danach
|
|
# komplett lokal, kein Netz, keine Telemetrie.
|
|
#
|
|
# Wenn Du nur FLUX.1-schnell nutzt (Apache-2.0, kein Gate), kannst Du
|
|
# das Feld leer lassen. Falls Du spaeter dev aktivierst:
|
|
# 1) https://huggingface.co/black-forest-labs/FLUX.1-dev → "Agree"
|
|
# 2) https://huggingface.co/settings/tokens → "Read"-Token erzeugen
|
|
# 3) Hier eintragen + docker compose restart flux-bridge
|
|
HF_TOKEN=
|
|
|
|
# Welches Modell beim Startup geladen wird, steuert ARIA selbst:
|
|
# Diagnostic > FLUX > Default-Modell. Solange dort nichts gewaehlt ist,
|
|
# laedt die flux-bridge erstmal nichts — sie wartet auf den ersten
|
|
# Render-Request oder einen Diagnostic-config-Broadcast.
|
|
|
|
# Offloading-Strategie (VRAM-Steuerung):
|
|
# model — Default. Komponentenweise CPU-Offload, gut fuer 12 GB Karten.
|
|
# sequential — sparsamer (Peak ~6 GB), aber 2-3x langsamer.
|
|
# none — alles auf GPU. Nur fuer >= 24 GB VRAM-Karten.
|
|
FLUX_OFFLOAD=model
|
|
|
|
# Float-Type. bfloat16 ist FLUX-native; auf alten Karten ohne BF16-Support
|
|
# auf float16 wechseln.
|
|
FLUX_DTYPE=bfloat16
|
|
|
|
# Hard-Caps gegen versehentlich teure Renders
|
|
FLUX_MAX_STEPS=50
|
|
FLUX_MAX_DIM=1536
|