Autarke Sprachsteuerung Roboter reagieren aufs Wort – auch wenn`s laut wird

Quelle: Aitad 3 min Lesedauer

Anbieter zum Thema

Sprachassistenten wie Alexa und Siri erleichtern den privaten Alltag. Doch auch in der Industrie und der Medizintechnik ist das nützlich, um Prozesse zu optimieren.

Erfahren Sie hier von den Experten von Aitad, wie autarke Sprachsteuerungen heute ihre Vorteile in der Industrie und der Medizintechnik ausspielen können.(Bild:  Aitad)
Erfahren Sie hier von den Experten von Aitad, wie autarke Sprachsteuerungen heute ihre Vorteile in der Industrie und der Medizintechnik ausspielen können.
(Bild: Aitad)

In vielen Haushalten hat der Einsatz von Sprachassistenten wie Alexa von Amazon und Siri von Apple den Alltag revolutioniert, heißt es. Nach einem so genannten Wake Word („Alexa!“, „Hey Siri“), welches die Applikation aktiviert, übermitteln die Geräte den Wunsch des Bedieners an einen entfernten Server, der den Sprachbefehl analysiert und anschließend das Auswertungsergebnis an das Helferlein zurücksendet. Das nennt sich Keyword spotting (KWS). So werden Musikwünsche erfüllt, ein Film auf die Playlist gesetzt oder das Weihnachtsgeschenk für die Liebste bestellt. Ähnlichkeiten dieses Ablaufs finde sich auch in der Industrie und Medizintechnik, bei denen KWS an Bedeutung zunehme.

Keyword spotting macht effizienter und rettet Leben

Damit können Prozesse beschleunigt und effizienter werden – unter Umständen sogar Leben gerettet. „Die Vorteile sind unübersehbar“, geht Viacheslav Gromov, Geschäftsführer vom KI-Anbieter Aitad, ins Detail. Denn wenn der Mitarbeiter die Maschine in der Produktion mit seiner Stimme steuere, dann bedeute das mehr Flexibilität. Er kann die Geräte aus der Ferne bedienen und muss keine Knöpfe mehr drücken oder auf dem Bildschirm der Maschine seine Eingabe eintippen. Die berührungslose Befehlsübermittlung vermeidet außerdem die Übertragung von Krankheitserregern auf die Systeme. Auch ein gerufener Befehl Stopp, wenn ein Unfall passiert, wirkt schneller als erst zur Maschine zu laufen.

Spracherkennung in Industrie und Medizintechnik

Die Übertragung von Sprachsignalen an entfernte Server geschieht allerdings im Rahmen von Latenzzeiten, die in sicherheitsrelevanten Umgebungen nicht akzeptabel sind, wie es weiter heißt. Ebenso spielten das Manipulations- und Ausfallrisiko einer Netzwerkverbindung eine Rolle. Der Einsatz in sicherheitskritischen Umgebungen in Industrie und Medizin erfordert folglich Möglichkeiten, die lokal und in Echtzeit arbeiten. Das ist der Punkt, an dem Sprachsteuerungsmodelle ins Spiel kommen, die mit Embedded-KI (künstliche Intelligenz) umgesetzt werden. Dabei werden nicht nur einzelne Wake Words erkannt, sondern bis zu 30 vordefinierte Begriffe, wodurch auch komplexe Befehle formuliert werden können. Ein Schlüsselwort aktiviert wieder das System. Anschließend können komplexe Kombinationen dieser vordefinierten Wortgruppe gesprochen und von der KI ausgewertet werden, die zusammen mit den Mikrofonen auf dem gleichen kleinen Board sitzt („Embedded-KI-Systemkomponente“). Beispiele für solche Sprachbefehle (hier im Beispiel mit „Roboter“ als Wake Word):

  • „Roboter, starte Programm A auf Maschine 3“;
  • „Roboter, Förderband 6 anhalten“;
  • „Roboter, Motor 4 in Maschine 3, erhöhe die Drehzahl um 40 Prozent“;
  • „Roboter, Rollstuhl, jetzt links abbiegen“;
  • „Roboter, Not-Aus“.

Entscheidend sei aber ein maximales Sicherheitslevel, das durch die lokale Verarbeitung der Sprachdaten – ohne Cloud oder Server – gewährleistet werden müsse. Das betrifft auch die Effizienz, weil die Befehle in Echtzeit direkt im Chip ausgewertet werden und die Maschine dadurch schneller reagiert“, erklärt Gromov weiter.

(ID:49934673)

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung