b3ff3991c4
Claude-Vision-API hat ~5MB Base64-Limit. Stefan's 4MB Foto via Buroklammer (DocumentPicker) sprengte das, Claude lieferte leere Antwort zurueck. Galerie-Pfad ging weil react-native-image-picker schon clientseitig komprimiert. Bridge resized jetzt JPEG/PNG/WebP/GIF >2MB auf max 1568px lange Seite (Anthropic-Empfehlung), JPEG q=85. SVG, PDF, ZIP, Office-Docs bleiben unangetastet — die laufen ueber Tools, nicht Vision. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
22 lines
703 B
Plaintext
22 lines
703 B
Plaintext
# ════════════════════════════════════════════════
|
|
# ARIA Voice Bridge — Abhängigkeiten
|
|
# ════════════════════════════════════════════════
|
|
|
|
# STT — Whisper (lokal, keine API noetig)
|
|
faster-whisper
|
|
|
|
# TTS: laeuft remote ueber XTTS v2 auf dem Gaming-PC (keine lokalen Deps noetig)
|
|
|
|
# WebSocket-Verbindung zu aria-core
|
|
websockets
|
|
|
|
# Audio-Verarbeitung
|
|
numpy
|
|
sounddevice
|
|
|
|
# Wake-Word Erkennung
|
|
openwakeword
|
|
|
|
# Bild-Resizing (zu grosse Pixel-Bilder shrinken bevor Claude-Vision sie sieht — 5MB-Limit)
|
|
Pillow
|