From 1ea614c26b4b67806e2c2ea94bae15a6f8dc0461 Mon Sep 17 00:00:00 2001 From: duffyduck Date: Sat, 23 May 2026 15:45:51 +0200 Subject: [PATCH] =?UTF-8?q?fix(brain):=20CPU-only=20torch=20=E2=80=94=20ve?= =?UTF-8?q?rhindert=205=20GB=20CUDA-Bloat=20im=20Brain-Image?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit sentence-transformers zieht torch als Dependency, und der Default-Wheel auf x86_64-linux ist die CUDA-Variante mit allen NVIDIA-Libs (nvidia-cudnn, nvidia-cublas, cuda-toolkit, triton, ...). ~5 GB pro Build-Layer, frisst die 22-GB-VM auf. Fix: torch CPU-Wheel explizit zuerst installieren. Damit ist die torch-Dependency erfuellt wenn sentence-transformers spaeter kommt, und die CUDA-Libs werden nie gezogen. Brain laeuft eh komplett auf CPU (MiniLM-Embeddings ~120 MB), GPU-Bloat war reine Disk-Verschwendung. Co-Authored-By: Claude Opus 4.7 (1M context) --- aria-brain/Dockerfile | 7 +++++++ 1 file changed, 7 insertions(+) diff --git a/aria-brain/Dockerfile b/aria-brain/Dockerfile index 851839a..8e23b6d 100644 --- a/aria-brain/Dockerfile +++ b/aria-brain/Dockerfile @@ -21,6 +21,13 @@ RUN apt-get update && apt-get install -y --no-install-recommends \ WORKDIR /app +# CPU-only torch zuerst — sonst zieht sentence-transformers den Default +# torch-Wheel der ~5 GB CUDA-Libs (nvidia-cudnn, nvidia-cublas, cuda-toolkit, +# triton, ...) als Dependencies einsaugt. Brain laeuft komplett auf CPU +# (MiniLM-Embeddings ~120 MB), wir brauchen das alles nicht. +RUN pip install --no-cache-dir torch==2.5.1 \ + --index-url https://download.pytorch.org/whl/cpu + COPY requirements.txt . RUN pip install --no-cache-dir -r requirements.txt