diff --git a/bridge/aria_bridge.py b/bridge/aria_bridge.py index b83ebb4..a064e79 100644 --- a/bridge/aria_bridge.py +++ b/bridge/aria_bridge.py @@ -257,6 +257,12 @@ def clean_text_for_tts(text: str) -> str: for pat, repl in _UNIT_WORDS: t = _re_tts.sub(pat, repl, t) + # Generisches Buchstabieren: alle verbleibenden 2-5-Zeichen-Grossbuchstaben-Woerter + # (XTTS, USB, DNS, JSON, HTML, ...) → "X T T S". Laeuft NACH der expliziten Liste, + # damit TTS/GPU/... schon aufgeloest sind. "WLAN"-artige, die als Wort gesprochen + # werden, koennen bei Bedarf explizit in _UNIT_WORDS uebersteuert werden. + t = _re_tts.sub(r'\b([A-Z]{2,5})\b', lambda m: " ".join(m.group(1)), t) + # Anfuehrungszeichen t = _re_tts.sub(r'["""„`]', '', t)