Hier erkläre ich dir wie ich meinen eigenen Sprachassistenten auf meinem Heimserver erstellt habe. Mein Ziel ist es das meine Daten auch mein bleiben. Für mich war auch wichtig die Ausgabe auf meinen Sonos Boxen zu haben. Eine künstliche Intelligenz mit einzubinden schien mir für Anfang zu anspruchsvoll und deswegen hier im Part 1 nur die Wahl des Systems.
Die richtige Software: Snips.ai ist bei einer Google-Suche das erste Ergebnis aber wurde leider diesen Januar (2020) eingestellt. Was für mich nicht in Frage kam war Dialogflow (früher api.ai) von Google welche nur minimale Verarbeitung bietet und alles extern verarbeitet. Schnell schwierig wurde es eine Plattform zu finden welche die Sprachanalyse nicht extern verarbeiten.
Das Datenverarbeitungskonzept von Sprachassistenten ist: 1. Sprache in Text umzuwandeln (STT) 2. diesen Text verarbeiten und 3. das Ergebnis als Sprache wieder auszugeben (TTS).
Nach Mycroft, was ein sehr flexibles Gerüst besitzt, kam für mich hauptsächlich Home-assistant.io mit Hass.io infrage. Mit seinen vielen Schnittstellen wie Sonos oder dem Deutschen Wetterdienst aber auch Ifttt um nur ein paar der ca. 1500 Applikation zu nennen. Home Assistant lässt einen viel steuern und bietet auch eine gute grafische Oberfläche.
Für den Sprachassistent sticht mir für völlige offline Verfügbarkeit Rhasspy als STT und MaryTTS oder Pico TTS ins Auge. Dazu mehr in Part 2.
Im nächsten Artikel (Part 2) die Installation von Homeassistant.