Spracherkennung in der Medizin: Erkennung ist (nicht) alles

In unserem letzten Blog haben wir die Konzepte vorgestellt, auf denen Spracherkennung basiert. Heute möchten wir darauf eingehen, was beim Einsatz von Spracherkennung zu beachten ist, um hervorragende Ergebnisse zu erreichen.
Von
Spracherkennung kann Digitalisierung im Krankenhaus vorantreiben.

    Die erfolgreiche Anwendung von Spracherkennung stellt einen Schlüssel zur Digitalisierung der Medizin dar. Spracherkennung ermöglicht einen unmittelbaren Geschwindigkeitsvorteil, da meist deutlich schneller gesprochen, als getippt oder geschrieben werden kann. Dementsprechend hoch sind Zufriedenheit und Arbeitstempo, wenn an dem diktierten Text wenig Korrekturen erfolgen müssen.

    Hierfür sind folgende Regeln zu beachten:
     

    1. Anpassung der Erkennung

      Auch bei einer technisch exzellenten Funktionsweise des verwendeten Spracherkennungssystems (exzellente Funktion der vier Elemente Audio, Extraktion, Vergleich, Ergebnis) gelten die oben genannten Paradigmen.

      Für eine optimale Funktion der Systeme ist eine Ausrichtung an gegenwärtig verwendeter Sprache erforderlich. Eine grundsätzliche Anpassung findet prinzipiell durch den Hersteller des Systems im Hintergrund statt (Updates, gebührenpflichtige Anpassung). Im Sinne einer derartigen Anpassung ist die Auswahl sogenannter „Fachvokabulare“ zu verstehen. Der Nutzen spezialisierter Vokabulare wird zum einen durch die allgemeine Verbesserung der Spracherkennungssysteme und zum anderen durch die weiterbestehende Notwendigkeit der Individualisierung gemindert. Das oft propagierte Einlesen großer Textmengen zur Anpassung setzt voraus, dass aus der geschriebenen Form eines Begriffes auf die gesprochene Form des Begriffes geschlossen werden kann. Dies ist in der Medizin oft nicht der Fall.

      Daher kommt der individuellen Anpassungsfähigkeit der Software eine große Bedeutung zu. Je nach verwendetem System erfolgt eine Anpassung durch Korrektur mit der Tastatur, durch das Hinzufügen geschriebener Wörter und durch das Hinzufügen vorgesprochener Wörter.

      Mit einer Kombination dieser Möglichkeiten und Steuerung der Korrekturvorgänge durch Sprache werden mit modernsten Systemen wie dem Dragon Medical Server von Nuance in kürzester Zeit individuell perfekte Ergebnisse auf zahlreichen Endgeräten erzielt. Das Sprechen von Trainingstexten ist obsolet. Der Dialekt des Sprechers hat einen weitaus geringeren Einfluss auf das Erkennungsergebnis als die korrekte Grammatik des gesprochenen Textes. Zu einer effektiven Anpassung zählen auch das individualisierte Aufrufen von Textblöcken oder Kommandos zur Textformatierung oder Steuerung des Endgerätes.

      Aus der Individualität von Sprache heraus folgt, dass sich Nutzer und Nutzerin zum Erreichen bester Funktionalität gegenüber dem Spracherkennungssystems identifizieren müssen. Diese Anmeldung am Spracherkennungssystem führt zur Auswahl eines sogenannten Sprachprofils. An Arbeitsplätzen mit einer hohen Zahl von Nutzern sollte der Wechsel des Sprachprofils möglichst schnell erfolgen können. Dies ist insbesondere dann der Fall, wenn der Ort der Erkennung nicht lokal auf dem Gerät erfolgt, in das gesprochen wird, sondern auf einem Server oder in der Cloud.

      Abbildung #3: Anpassung der Erkennung
       

      2. Ort der Erkennung

        Spracherkennung setzt leistungsfähige IT-Hardware voraus. Beispielsweise erfolgt Spracherkennung im Rahmen der allgemeinen Nutzung auf mobilen Endgeräten in der Regel auf US-amerikanischen Servern. Hingegen führen die derzeit am meisten verbreiteten Systeme im medizinischen Bereich die Erkennung mit lokaler Hardware durch. Dies beeinträchtigt das Erkennungsergebnis – auch bei grundsätzlich steigender Leistungsfähigkeit der Hardware. Störender im klinischen Alltag ist allerdings die Einschränkung der Funktionalität. Mobilität oder individuelle Anpassungsvorgänge an verschiedenen Endgeräten etwa stehen gar nicht oder nur engeschränkt zur Verfügung.

        Mit der fortschreitenden Digitalisierung der Medizin und dem zunehmenden Einsatz mobiler Endgeräte erlangt der Ort der Erkennung somit eine immer größere Bedeutung. Die Verarbeitung der Sprachdaten auf US-amerikanischen Servern ist im medizinischen Bereich entweder nicht wünschenswert oder nicht zulässig. Daher erscheinen lokale oder regionale Cloud-Lösungen die derzeit beste Lösung zu sein, um individualisierte Spracherkennung auf beliebigen Endgeräten verfügbar zu machen.
         

        3. Zeitpunkt der Erkennung

          Die größte Veränderung im klinischen Prozess stellt die sofortige Verfügbarkeit des Textes dar. Großer Nutzen wird durch eine gute Abstimmung eines Spracherkennungssystems mit den Belangen der klinischen Anwender hinsichtlich Dokumenten-Workflow, Formatierungen oder Einfügen Befunde Dritter erzielt.

          Jetzt runterladen und lesen!

          Künstliche Intelligenz für die medizinische Dokumentation: Dokumentationsprozesse optimieren und beschleunigen und damit die Patientenbetreuung und -zufriedenheit verbessern.

          Download

          Schlagwörter: , , , , , , , , , , , , ,

          About Milko Jovanoski

          Milko Jovanoski ist seit 2012 bei Nuance Healthcare, wo er zunächst für das Partner und Produkt Marketing in Europa zuständig war. Seit 2015 ist er als International Marketing Manager Healthcare für den gesamten Bereich Marketing in den Regionen EMEA, APAC und LatAM verantwortlich. Herr Jovanoski verfügt über langjährige Erfahrung mit Spracherkennung und war vor seiner Tätigkeit bei Nuance in verschiedenen Managementpositionen in Sales & Marketing in Healthcare-IT tätig. Milko Jovanoski verfügt über einen Executive Master of Business Administration von der Fachhochschule in Chur, Schweiz.