Kurztipp: Sprachsynthese mit SherpaTTS

Kurztipp: Sprachsynthese mit SherpaTTS

SherpaTTS is eine empfehlenswerte Text-to-Speech-Engine. Auf meinem Fairphone mit /e/OS hat sie die Sprachausgabe erheblich verbessert.>

Nachdem mein eingebautes Navi im Auto nun wirklich hoffnungslos veraltet ist, habe ich mal CoMaps auf dem Fairphone (Gen. 6) zur Navigation ausprobiert. Das hat – trotz fehlender Verkehrsinformationen – erstaunlich gut funktioniert. Allerdings, die Sprachansagen waren furchtbar. Ich fühlte mich an die 80er Jahre und den (damals tollen!) Amiga 500 erinnert.

Das Problem

Ich muss dazu sagen: Ich verwende /e/OS auf dem Fairphone. Wer ein Standard Google-Android verwendet hat das Problem vermutlich nicht und kann auf die google-eigene Sprachsynthese zurückgreifen. Ein anderes Custom-ROM und/oder Smartphone mag ebenfalls standardmäßig eine andere (bessere?) Spachsynthese verwenden. “Mein” /e/OS jedenfalls verwendet eSpeak als Text-to-Speech Engine – und die ist nach meinem Empfinden einfach schlecht. Vielleicht habe ich Einstellungsmöglichkeiten übersehen, aber es ist mir nicht gelungen, eine erträgliche Sprachausgabe zu erzeugen.

Die Lösung: SherpaTTS

Auf der Suche nach einer Alternative bin ich im F-Droid Store auf SherpaTTS gestoßen. SherpaTTS sagt über sich selbst (sinngemäß übersetzt):

SherpaTTS ist eine Android Text-to-Speech-Engine, die auf Next-gen Kaldi basiert. Sie verwendet Stimmen von Piper Voices oder Coqui.

Kurztipp: Sprachsynthese mit SherpaTTSKurztipp: Sprachsynthese mit SherpaTTSDas Ergebnis war prompt um Welten besser. Die Navigationsansagen aus CoMaps hörten sich auf Anhieb “gut” an. Vielleicht hadert der eine oder die andere ja auch mit der Qualität der Sprachsynthese und findet mit SherpaTTS Abhilfe. Habt ihr weitere Tipps oder andere Erfahrungen zu dem Thema?

Quellen:

  • Titelbild: https://github.com/woheller69/ttsEngine
Share the Post:

Related Posts