Die Geschichte der Spracherkennung – Teil 2

In Teil eins dieses Blogs haben Sie erfahren, welchen bedeutenden Anteil Dragon an der Umwandlung von Sprache in editierbaren Text und die Sprachsteuerung von Computern hat. Insbesondere mit Blick auf die technologischen Möglichkeiten in der jeweiligen Zeit hat die Dragon Spracherkennung mit jedem neuen Entwicklungsschritt Meilensteine gesetzt. Und das Unternehmen setzt alles daran, den Vorsprung zu behalten. In diesem zweiten Teil betrachten wir die Gegenwart und wagen einen Blick in die Zukunft.
Von
Nuance Dragon Spracherkennung Geschichte Teil 2

Spracherkennung hat ihren Ursprung lange bevor Computer in ihrer uns bekannten Form existierten. Schon in den 1880ern erfand Alexander Graham Bell eine Möglichkeit, Sprache auf einem Wachszylinder aufzunehmen. Es folgten stetige Verbesserungen der Technologien wie Kunststoff und Magnetbänder. Lesen Sie dazu mehr in unserem Teil 1 zur Geschichte der Spracherkennung.

Nachdem Computer technisch immer ausgefeilter wurden und Speicher sowie Prozessoren Einzug hielten, machte die Entwicklung der Spracherkennung riesengroße Fortschritte. Erste Spracherkennungssysteme verfügten jedoch über einen stark begrenzten Wortschatz und mussten zudem auf die jeweilige Sprecherstimme trainiert werden. Die Systeme arbeiteten mittels eines Musterabgleichs.

 

Ein neuer Weg des Arbeitens mit Spracherkennung

Als sich die Mathematiker Dr. Jim Baker und Dr. Janet Baker entschlossen, eine Spracherkennung zu entwickeln, läuteten sie einen Paradigmenwechsel ein. Sie verwendeten vorausschauende Techniken zur Spracherkennung. Dragon Systems startete 1982. Viele Produktversionen später kam 1997 Dragon Naturally Speaking auf den Markt. Es war die erste Spracherkennungssoftware, bei der die Anwender auf normale, natürliche Weise und ohne Pause zwischen einzelnen Wörtern sprechen konnten.

Dennoch mussten die Nutzer zu jener Zeit noch das System mit ihrer Stimme vertraut machen. Dazu mussten sie dem System über ein kurzes Trainingsprogramm einige Texte laut vorlesen.

Ein weiterer großer Durchbruch gelang 2006 mit der Veröffentlichung von Dragon Naturally Speaking 9. Erstmals mussten die Nutzer nicht mehr die einleitende Registrierung ihrer Sprache durchführen. Die Spracherkennung arbeitete bereits direkt ab dem ersten Einsatz mit 99‑prozentiger Genauigkeit. Die Anwender konnten buchstäblich direkt nach der Installation der Software mit dem Diktieren beginnen.

 

Technologische Horizonte ausweiten

Im Jahr 2007 feierte Dragon zehnjähriges Jubiläum und konnte sich rühmen, 160 Wörter pro Minute mit 99-prozentiger Genauigkeit zu erkennen. Inzwischen war Dragon auch international erfolgreich: Es gab Versionen in Englisch, Niederländisch, Französisch, Deutsch, Italienisch und Spanisch. Bereits im Jahr zuvor wurde Dragon Naturally Speaking in speziellen Versionen für Mediziner und Rechtsanwälte vorgestellt, die es diesen Berufszweigen ermöglichten, branchentypische Sprache und Ausdrücke zu erkennen.

Diese Durchbrüche sind umso bemerkenswerter, wenn man betrachtet, was 2007 technologisch sonst in der Welt passierte. Wir waren noch weit entfernt von der heutigen Technologie-Landschaft:

  • Apple brachte das erste iPhone auf den Markt. (Das erste iPad kam erst 2010; Android tauchte erstmals 2008 in einem kommerziellen Mobiltelefon auf.)
  • Hitachi präsentierte die weltweit erste Festplatte mit 1TB Speicher.
  • Amazon stellte in den USA den ersten Kindle vor (außerhalb der USA kamen die Geräte erst 2009 zu den Händlern).

Seitdem hat Dragon neue Technologien übernommen, sobald sie entwickelt waren. So hat Dragon zum Beispiel Techniken zum Deep Learning dazu verwendet, die Erkennung individueller Sprachmuster zu verbessern – und so die Vorhersagefähigkeit und damit die Geschwindigkeit sowie die Genauigkeit zu erhöhen.

 

Auf zu neuen Ufern

Längst hat der Erfolg der Smartphones den Weg für eine neue Dragon-Anwendung geebnet: Dragon Anywhere, das 2015 auf den Markt kam. Dragon Anywhere läuft mit Android und iOS. Es kann auf personalisierte Standardsätze und Befehle zugreifen und synchronisiert sich über eine Cloud mit der im Büro installierten Dragon Software. Das bedeutet, dass Nutzer ein Diktat unterwegs beginnen und später im Büro beenden können.

In den frühen Tagen der 1980er Jahre existierten keine Dinge wie Smartphones, Cloud Computing, künstliche Intelligenz und weitere Aspekte der Computertechnologie, die für uns heutzutage längst selbstverständlich sind. Dragon hat sie alle aufgegriffen und verfolgt damit das Ziel, die Produktivität bei Dokumentationen zu erhöhen und Arbeitsabläufe zu verbessern. Dadurch können Kunden Zeit und Geld sparen, den Kundenservice verbessern und auf das Erreichen ihrer eigenen Ziele hinarbeiten.

Schlagwörter: , , , ,

Sandra Noetzel

Über Sandra Noetzel

Sandra Noetzel verantwortet das Marketing für Dragon Professional & Consumer (P&C) innerhalb des Geschäftsbereiches Healthcare für DACH und Frankreich. Die ehemalige Tennisspielerin hat an der University of Nebraska, Lincoln und in Oxford, England Kommunikationswissenschaften, Marketing und internationale Ökonomie studiert. Sie liebt College Football, County Music und die Sonne.