Jede Minute zählt: Spracherkennung in der Medizin

Bereits der altägyptische Wundenbuch-Papyrus ist ein Beispiel dafür, dass eine gute medizinische Dokumentation die Qualität einer medizinischen Dienstleistung erhöht: mit ihr lassen sich die Struktur-, Prozess- und Ergebnisqualität verbessern. Zur Abrechnung einer Leistung dient die medizinische Dokumentation zunächst der Bereitstellung von strukturierten oder kodierten Informationen, die eine klinische Situation im Rahmen eines Vergütungssystems wie DRG (Diagnosis Related Groups) oder EBM (Einheitlicher Bewertungsmaßstab) repräsentieren soll. Wenn die Vergütung einer medizinischen Leistung zunehmend an der Ergebnisqualität orientiert wird, ist eine sorgfältige und zeitnahe digitale medizinische Dokumentation mehr denn je Voraussetzung für medizinischen und ökonomischen Erfolg.
Von
Spracherkennung kann Digitalisierung im Krankenhaus vorantreiben.

 
Die Digitalisierung der Medizin wird begleitet von der Notwendigkeit, klinische Informationen digital verfügbar zu machen. Damit dies am Patientenbett, bei der mobilen Visite oder beim Hausbesuch gelingt, ist Spracherkennung eine sinnvolle und notwendige Ergänzung der Dokumentationsprozesse. Exzellente Spracherkennung wird heute durch hochmoderne Technologien wie Maschinelles Lernen und Deep Learning in sogenannten Neuronalen Netzen mittels komplexer statistischer Modelle möglich gemacht. Durch diese komplexen Vorgänge im Hintergrund wird moderne Spracherkennungssoftware wie die Dragon-Reihe von Nuance immer einfacher und intuitiver – somit kommt der Anwendung außerhalb von Nischen eine immer größere Bedeutung zu.

Elektronische Krankenakten lassen sich vereinfacht ausfüllen, die klinische Dokumentation vermehrt automatisieren und Qualitätsstandards besser einhalten. Intelligente Assistenz- und Beratungssysteme werden die klinische Arbeit zunehmend unterstützen können. Jede Minute, die Ärzte und Krankenschwestern durch Spracherkennung und sofortige Befundverfügbarkeit einsparen, kann dem Patienten in Form intensiverer Betreuung und Pflege zugutekommen.

Die breite Verfügbarkeit von Spracherkennung stellt einen eleganten und effizienten Weg zur Digitalisierung von Informationen dar, da neben einem Geschwindigkeitsvorteil Interoperabilität in der Bedienung von IT-Systemen entsteht. Einfach gesagt: Spracherkennung ermöglicht bessere Prozesse und mehr Zeit für Patienten.
 

Die Grundlagen der Spracherkennung

Die elektronische Umwandlung von Sprache in Text wird als Spracherkennung bezeichnet. Spracherkennungssysteme arbeiten auf einer einheitlichen Grundlage, die vier wesentliche Elemente umfasst:

(1) Eine Sensorik zur Erfassung der Schallwellen (Audio)

(2) Eine Analytik zur Umsetzung der Schallwellen in charakteristische digitale Muster (Extraktion)

(3) Ein Abgleich dieser Muster mit im Computer hinterlegten sprachlichen Informationen (Vergleich)

(4) Eine abschließende grammatikalische Interpretation (Ergebnis)

Aus diesem grundsätzlichen Ablauf ergeben sich wichtige Konsequenzen, die für den klinischen Einsatz und insbesondere für den meist intuitiv stattfindenden Vergleich mit einem menschlichen Hörer essenziell sind. Bereits ein defektes Mikrofon stört im Prozess. Während ein menschlicher Hörer hierüber Rückmeldung geben kann, ist dies einem Spracherkennungssystem nicht möglich.
 

Die Paradigmen der Spracherkennung

1. Spracherkennung erkennt nur bereits Bekanntes.

In der klinischen Nutzung besteht insbesondere die Erwartung, dass Namen von Patienten erkannt werden. Dies setzt allerdings voraus, dass der jeweilige Name dem Spracherkennungssystem bereits bekannt ist. Diesem Dilemma kann nur durch einen erheblichen technischen Aufwand oder durch den Benutzer des Systems selbst begegnet werden:

    • Das System „erkennt“, um welchen Patienten es geht und verwendet diesen Namen vorübergehend für die Erkennung. Dies setzt einen Zugriff der Spracherkennung auf das Krankenhausinformationssystem beziehungsweise auf eine Patientenliste voraus.
    • Der Benutzer fügt dem System den Namen hinzu. Hierdurch entsteht im Spracherkennungssystem eine Ansammlung von Namen, die möglicherweise durch den Benutzer in Zukunft gar nicht mehr benötigt werden. Die Anwesenheit nicht benötigter Annahmen erschwert dann den Abgleich.
    • Der Benutzer verwendet den Namen nicht, sondern diktiert stattdessen etwas wie „der Patient“ oder „die Patientin“.

2. Spracherkennung schreibt auf, was gesagt wurde.

Um einen korrekten Text zu erhalten, müssen sämtliche Satzzeichen in der richtigen Reihenfolge und zum richtigen Zeitpunkt diktiert werden. Das Diktat von „in Klammern“ führt zum geschriebenen Text in Klammern. Um einen Abschnitt zu umklammern muss an der richtigen Stelle „Klammer auf“ und „Klammer zu“ diktiert werden.

3. Spracherkennung bedeutet nicht Sprachverständnis

In der Anwendung von Spracherkennung sind drei Funktionsebenen abzugrenzen.
Ebene I: Sprache wird in Text umgewandelt. Dies ist Spracherkennung im ursprünglichen Sinn.
Ebene II: Sprache wird für Kommandos und Steuerung verwendet. Das Gesprochene soll nicht aufgeschrieben, sondern zur Steuerung eines Computers oder einer Maschine verwendet werden.
Ebene III: Sprache wird semantisch oder mittels künstlicher Intelligenz analysiert. Diese Ebene wird von einem Menschen intuitiv erwartet, die klinische Anwendung von Spracherkennung findet jedoch vorwiegend in Ebene I oder Ebene II statt, wobei in Zukunft fließende Übergänge zwischen den Ebenen entstehen.

Die erfolgreiche Anwendung von Spracherkennung stellt einen Schlüssel zur Digitalisierung der Medizin dar. Spracherkennung ermöglicht einen unmittelbaren Geschwindigkeitsvorteil, da meist deutlich schneller gesprochen, als getippt oder geschrieben werden kann. Dementsprechend hoch sind Zufriedenheit und Arbeitstempo, wenn an dem diktierten Text wenig Korrekturen erfolgen müssen.

Was dabei zu beachten ist, erläutern wir in Teil 2 unseres Blogeintrags ‚Spracherkennung in der Medizin‘.

Sources:

Jetzt runterladen und lesen!

Künstliche Intelligenz für die medizinische Dokumentation: Dokumentationsprozesse optimieren und beschleunigen und damit die Patientenbetreuung und -zufriedenheit verbessern.

Learn more

Schlagwörter: , , , , , , , , , , , , ,

About Milko Jovanoski

Milko Jovanoski ist seit 2012 bei Nuance Healthcare, wo er zunächst für das Partner und Produkt Marketing in Europa zuständig war. Seit 2015 ist er als International Marketing Manager Healthcare für den gesamten Bereich Marketing in den Regionen EMEA, APAC und LatAM verantwortlich. Herr Jovanoski verfügt über langjährige Erfahrung mit Spracherkennung und war vor seiner Tätigkeit bei Nuance in verschiedenen Managementpositionen in Sales & Marketing in Healthcare-IT tätig. Milko Jovanoski verfügt über einen Executive Master of Business Administration von der Fachhochschule in Chur, Schweiz.