DStR Heft 41 – 2016

DStR Heft 41 – 2016

Haben Sie heute schon mit Ihrem Computer gesprochen?

Spracherkennung in der Steuerkanzlei

Spracherkennungstechnologie sorgt für mehr Sicherheit beim Autofahren und mehr Komfort bei der Smartphone-Nutzung. Spracherkennung ist im Alltag angekommen, einfach und ohne großen Aufwand zu bedienen. Häufig wird Spracherkennung nur als Ersatz für eine Menübedienung genutzt. Entsprechend überschaubar und auf bestimmte Spezialgebiete begrenzt ist dann der hinterlegte Wortschatz. Bei Smartphones kommen neben einer zumeist umfangreicheren Spracherkennung zunehmend auch Sinnerkennungen zum Einsatz, die versuchen sollen, Befehle und Fragen des Nutzers – „wie wird das Wetter“ – zu erkennen. Diese Sprachassistenzsysteme setzen regelmäßig eine Verbindung zu einem i.d.R. nicht datengeschützten Server im Internet voraus. Im Kanzleialltag sind die Anforderungen andere – hier müssen Gedanken und Gespräche in Form von Schriftsätzen, E-Mails, Protokollen oder Notizen mit der ganzen Bandbreite der deutschen Sprache möglichst schnell dokumentiert und Mandanteninformationen vor dem Zugriff Dritter geschützt werden.

Wie funktioniert Spracherkennung?

Das Audiosignal des Anwenders wird in die kleinsten Sprachmerkmale, sogenannte Phoneme, reduziert. In Abgleich mit einem Lexikon ermittelt die Spracherkennung aus dieser Phonemfolge die diktierten Wörter. Durch ein Sprachmodell wird dann das Ergebnis mit Blick auf im Deutschen übliche Wortabfolgen überprüft und korrigiert. Die Spracherkennung funktioniert am besten, wenn Sprache und Wortgebrauch des Diktats dem Stimm- und Wortmaterial des Spracherkennungssystems ähneln. Aus diesem Grund werden das Sprecherprofil und das Lexikon bei der Nutzung kontinuierlich angepasst. Für den Steuerberater gilt: Die Spracherkennung sollte von Anbeginn einen steuerrechtlich ausgerichteten Wortschatz mit „typischen“ Wortfolgen des Steuerwesens beinhalten.

Ist Spracherkennung für den Steuerberater interessant?

Die schriftliche Kommunikation verursacht im Büroalltag hohen Zeit- und Kostenaufwand. Entweder tippt der Anwender ungeachtet seiner Fähigkeiten selbst oder er erzeugt ein Diktat und lässt dieses im Sekretariat weiterverarbeiten. Die Produktivität lässt sich hier nur durch Erhöhung des Personals oder durch schnelleres Schreiben verbessern. Mehr Personal bedeutet höhere Personalkosten und der Schreibgeschwindigkeit sind physikalische Grenzen gesetzt. Die Lösung des Problems liegt in der konsequenten Nutzung der Sprechgeschwindigkeit, die dreimal schneller ist als Tippen. Der optimale Weg vom Gedanken zum Schriftstück führt über die computergesteuerte Erkennung der Sprache und die automatische Umwandlung zu Text.

Fazit

Heutige Spracherkennungssysteme zeichnen sich durch Schnelligkeit, Genauigkeit und Benutzerfreundlichkeit aus. Sie bieten eine leistungsstarke Alternative zur herkömmlichen Dokumentenerstellung. Für die Steuerkanzlei bedeutet das: Mehr Effizienz und Effektivität in den täglichen Arbeitsabläufen und damit mehr Zeit für Tätigkeiten mit höherer Wertschöpfung, wie Mandantengespräche, Recherchen oder Weiterbildungsmaßnahmen. Ein Test zeigt schnell, ob die Spracherkennung zum Arbeitsablauf passt.

Hinweis zum Autor:

Jens Müller, ass.jur.
ist Leiter Marketing und Vertrieb bei
datatronic beka technologies GmbH, Osnabrück