From 87b4cd305c4b7b2ede0b281a4c7ce92968bbcd61 Mon Sep 17 00:00:00 2001 From: duffyduck Date: Sat, 25 Apr 2026 00:26:51 +0200 Subject: [PATCH] docs: veraltete F5-TTS-Backlog-Items ausmisten - Audio-Normalisierung: nie aufgefallen, bei Bedarf zurueck - F5-TTS Streaming-Inferenz: Upstream-Feature, nicht unseres - Deepspeed: premature optimization, Render ist durch Pre-Roll kaschiert schnell genug - BigVGAN-Support: obsolet seit Vocos + aihpi German Fine-Tune laeuft Co-Authored-By: Claude Opus 4.7 (1M context) --- issue.md | 6 ------ 1 file changed, 6 deletions(-) diff --git a/issue.md b/issue.md index 27a25de..c7ae7d5 100644 --- a/issue.md +++ b/issue.md @@ -95,12 +95,6 @@ oeffnet Modal mit Textfeld (Default-Beispieltext wird jedesmal neu gesetzt) und Play-Button → Stimme rendert den Text und spielt im Browser ab -### TTS / Audio -- [ ] Audio-Normalisierung (Lautstaerke zwischen Saetzen/Chunks angleichen) -- [ ] F5-TTS: Streaming-Inferenz testen (nativ statt satzweise) wenn ein passendes Backend kommt -- [ ] F5-TTS: Optional Deepspeed-Beschleunigung pruefen -- [ ] F5-TTS: BigVGAN-Vocoder-Support in Bridge (aktuell nur Vocos) - ### Architektur - [ ] Bilder: Claude Vision direkt nutzen (aktuell nur Dateipfad an ARIA) - [ ] Auto-Compacting und Memory/Brain Verwaltung (SQLite?)