docs: veraltete F5-TTS-Backlog-Items ausmisten
- Audio-Normalisierung: nie aufgefallen, bei Bedarf zurueck - F5-TTS Streaming-Inferenz: Upstream-Feature, nicht unseres - Deepspeed: premature optimization, Render ist durch Pre-Roll kaschiert schnell genug - BigVGAN-Support: obsolet seit Vocos + aihpi German Fine-Tune laeuft Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
parent
190352820c
commit
87b4cd305c
6
issue.md
6
issue.md
|
|
@ -95,12 +95,6 @@
|
|||
oeffnet Modal mit Textfeld (Default-Beispieltext wird jedesmal neu gesetzt)
|
||||
und Play-Button → Stimme rendert den Text und spielt im Browser ab
|
||||
|
||||
### TTS / Audio
|
||||
- [ ] Audio-Normalisierung (Lautstaerke zwischen Saetzen/Chunks angleichen)
|
||||
- [ ] F5-TTS: Streaming-Inferenz testen (nativ statt satzweise) wenn ein passendes Backend kommt
|
||||
- [ ] F5-TTS: Optional Deepspeed-Beschleunigung pruefen
|
||||
- [ ] F5-TTS: BigVGAN-Vocoder-Support in Bridge (aktuell nur Vocos)
|
||||
|
||||
### Architektur
|
||||
- [ ] Bilder: Claude Vision direkt nutzen (aktuell nur Dateipfad an ARIA)
|
||||
- [ ] Auto-Compacting und Memory/Brain Verwaltung (SQLite?)
|
||||
|
|
|
|||
Loading…
Reference in New Issue