docs: veraltete F5-TTS-Backlog-Items ausmisten
- Audio-Normalisierung: nie aufgefallen, bei Bedarf zurueck - F5-TTS Streaming-Inferenz: Upstream-Feature, nicht unseres - Deepspeed: premature optimization, Render ist durch Pre-Roll kaschiert schnell genug - BigVGAN-Support: obsolet seit Vocos + aihpi German Fine-Tune laeuft Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
parent
190352820c
commit
87b4cd305c
6
issue.md
6
issue.md
|
|
@ -95,12 +95,6 @@
|
||||||
oeffnet Modal mit Textfeld (Default-Beispieltext wird jedesmal neu gesetzt)
|
oeffnet Modal mit Textfeld (Default-Beispieltext wird jedesmal neu gesetzt)
|
||||||
und Play-Button → Stimme rendert den Text und spielt im Browser ab
|
und Play-Button → Stimme rendert den Text und spielt im Browser ab
|
||||||
|
|
||||||
### TTS / Audio
|
|
||||||
- [ ] Audio-Normalisierung (Lautstaerke zwischen Saetzen/Chunks angleichen)
|
|
||||||
- [ ] F5-TTS: Streaming-Inferenz testen (nativ statt satzweise) wenn ein passendes Backend kommt
|
|
||||||
- [ ] F5-TTS: Optional Deepspeed-Beschleunigung pruefen
|
|
||||||
- [ ] F5-TTS: BigVGAN-Vocoder-Support in Bridge (aktuell nur Vocos)
|
|
||||||
|
|
||||||
### Architektur
|
### Architektur
|
||||||
- [ ] Bilder: Claude Vision direkt nutzen (aktuell nur Dateipfad an ARIA)
|
- [ ] Bilder: Claude Vision direkt nutzen (aktuell nur Dateipfad an ARIA)
|
||||||
- [ ] Auto-Compacting und Memory/Brain Verwaltung (SQLite?)
|
- [ ] Auto-Compacting und Memory/Brain Verwaltung (SQLite?)
|
||||||
|
|
|
||||||
Loading…
Reference in New Issue