Testbericht Olympus WS-110 DNS Version mit Spracherkennung
17.02.2009
Diese beiden kuriosen Wort-Gebilde sind tatsächlich beim Diktieren dieses Produkttests entstanden und stehen klischeehaft für die Fehleranfälligkeit von Spracherkennungssoftware. Doch trotz dieser belustigenden Fehler liefert die Software einen arbeitsfähigen Text, der lediglich 5,4% fehlerhafte Wörter enthält (19 Wörter von 352). Um Ihnen einen Einblick in die tatsächlichen Ergebnisse zu liefern, wurde der untenstehende Text diktiert und mit Dragon NaturallySpeaking umgewandelt. Die produzierten Fehler sind dann manuell korrigiert worden und als durchgestrichener Text weiterhin sichtbar. Den genauen Testbericht können sie also unten nachlesen - selbstverständlich mit Spracherkennung erstellt.
Die Aufnahme des Textes dauerte 4 Minuten. Der Computer benötigte rund 5 Minuten zur Übersetzung in Schrift, anschließend waren rund 3 Minuten für die Fehlerkorrektur nötig. Die Korrektur wird angenehm unterstützt, indem die Software - ähnlich der Rechtschreibkorrektur in Word -sinnvolle Alternativen anbietet, die lautsprachlich ähnlich klingen. Zum Vergleich: Das Abtippen des gleichen Textes beanspruchte in unserem Test 10 Minuten. Das bedeutet, das hier in diesem einfachen und kurzen Beispiel ein etwas geringeres Zeitbudget aufgewendet werden muss. Wie sich dies bei längeren Anwendung darstellt, muss zunächst unbeantwortet bleiben.

welche vom WS-110 aufgezeichnet und dann von Dragon umgesetzt wurde.
Das Original Diktat NACH Erkennung durch Dragon Version 9 mit Fehleranmerkungen.
-- Diktat Start --
Für rund 100 € bietet Olympus ein Aufnahmegerät samt Spracherkennungssoftware von Dragon (Versionen neun). Das klingt spannend und erschwinglich. Doch wie zuverlässig arbeitet dieses Duo?Beruf?
Aufnahmegerät
Gleich vorweg: es handelt sich bei dem Aufnahmegerät um einen so genannten VoiceBeuys Recorder (Notetaker),(laut Steger), also nicht um ein vollwertiges Diktiergerät. Es ist leider nicht möglich, die Aufnahme zurück zu spulensprudeln und einen Fehler zu übersprechen.besprechen. Wer auf diese Funktion aber verzichten kann, hat mit dem Olympus WSWalter Siegfried -110 ein funktionales und einfach zu bedienen des MonoUNO Aufnahmegerät.
Software
Dragon NaturallySpeaking wird in der so genannten Recorderversion mitgeliefert, welches speziell für die VerschriftlichungVerstaatlichung von Audiodateien aus einem Aufnahmegerät geeignet ist. Das direkte Diktieren in den Computer über ein Mikrophon ist allerdings nicht möglich. Die Installation ist einfach und unkompliziert und man benötigt nur wenige Minuten. Etwas aufwändiger ist das nötige Training der Software dennwerden für jeden Nutzer wird ein eigenes SprachprofilSprachrohr angelegt. Hierzu ist es nötig, einen vorgegebenen Text auf zu auszusprechen. Dieses benötigt etwa 30 Minuten. Danach ist die Software einsatzbereit.
Funktioniert Kontrolliertes?
Die Anwendung ist denkbar einfach. Sie nehmen ihren Text mit dem Aufnahmegerät auf. Das Aufnahmegerät lässt sich auseinander klappenklaffen und in einen USB Stick verwandeln. Nachdem die Spracherkennungssoftware gestartet wurde, schließen Sie einfach das Aufnahmegerät an den Rechner an, klicken in Dragon auf "umwandeln" und nach kurzer Zeit erscheint der getipptegetötete Text auf dem Bildschirm. Allerdings nur dann, wenn lediglich sie selbst gesprochen haben. Gespräche von oder mit anderen Personen werden nicht einmal annähernd erkannt. Mehr über die Spracherkennung von Gesprächen mit mehreren Personen erfahren Sie in unserer empirischen Studie.
Das Ergebnis der Textumwandlung sehen Sie hier.
Leider bleibt stets eine Fehlerkorrektur nötig, die sich allerdings in Grenzen hält, solange das Diktat sehrder deutlich gesprochen wird. Durch die Fehlerkorrektur wird das Sprachprofilsprach Profil weiter gepflegt und die Genauigkeit erhöht sich somit mit der Zeit. Während der Aufnahme sind Diktierbefehlenicht so viele hilfreich, mit denen ein Absatz oder ein Zeilenumbruch eingefügt werden kann.
Fazit
Wer keine explizite Diktier-tägliche Anwendung sucht, sondern die Möglichkeit, sich beim tippen von Notizenvermuteten und kurzen Texten unterstützen zu lassen, hat mit dem Olympus Aufnahmegerät plus Spracherkennungssoftware eine funktionale und günstige Lösung.
-- Diktat Ende --
ist eine gute sache aber gibt es eine spracherkennungssoftware von einer normalen audiodatei die das ganze dann in einen text umwandelt ??
Hallo Anonymus,
genau davon handelt dieser Test.
Funktioniert das eigentlich auch bei der Transkription von Interviews? Man kann die Interviewpartner ja schlecht darum bitten, erst einen Probetext einzsprechen.
Hallo Phosphorus, Interviews mit Spracherkennung zu transkribieren wird von vielen hunderttausend Menschen benötigt und gewünscht. Leider existiert keine Software die das auch nur annähernd könnte. Wir haben das in einer empirische Studie genauer untersucht, die hier nachzulesen ist:
http://www.audiotranskription.de/transkription/literatur-und-hinweise/sp...
Ah, vielen Dank für den Link. Lese ich mir gleich mal durch (sorry, den Artikel hatte ich zuvor nicht entdeckt).
Hallo zusammen,
also bei mir hat das gut geklappt, die Interviews nachzusprechen. Es war vielleicht eine Zeitersparnis von (geschätzten 30-40%) und weniger anstrengend als zu tippen (hatte zumindest weniger Kopfschmerzen).
Ich muss dazu sagen, dass ich Dragon 10 Professional verwende, das m.E. etwas teurer ist als die Preferred-Version.
Und ich benutze es, weil meine Handgelenke schlapp gemacht haben (ich hatte 35 Interviews und habe die letzten sieben mit Dragon transkribiert), werde meine künftigen Interviews (wohl an die 60) auch damit transkribieren (lassen).
Allerdings kommt es auch darauf an, welche Art Transkript man braucht. Bei mir hat der "reine" Inhalt gereicht und nicht die Art Transkript, wie sie Jan Kruse in seinen Workshops vorstellt (die übrigens sehr zu empfehlen sind).
Viel Erfolg weiterhin!
Hallo, Ihr Test deckt sich mit unseren Erfahrungen mit einer für unser Unternehmen speziell entwickelten Software von Nuance. Diese Software kann live Radiobeiträge in Text verwandeln. Sie kostet allerdings pro verwendetem Analyse-Server gut das 300fache der einfachen Dragon-Version als Lizenz. Natürlich sind das keine Transkripte, die wir anfertigen. Wir brauchen nur Plain Text. Nach einer Schulungszeit von gut einem halben Jahr hat die Software es geschafft annähernd brauchbare Texte aus dem Radio zu "Papier" zu bringen. Dies mit einer Fehlergenauigkeit von gut 85%. Je mehr Dialekt hinein kommt, desto länger braucht der Lernprozess. Besser als diese 85% wird allerdings auch diese Software derzeit nicht. Die manuelle Nachkorrektur ist aufgrund des Zeitfaktors nicht lohnend. Wir hatten zuvor schon mit dem Fraunhofer Institut gearbeitet, wo auch keine bessere Lösung des Problems in Aussicht gestellt wurde. Als Kernaussage würde ich hier zusammenfassen: Mit viel Geld kann man sich derzeit nur Geschwindigkeit aber keine größere Genauigkeit verschaffen.
Hallo, funktionieren Programme wie Dragon Naturally Speaking nur, wenn man den Text fließend abliest und quasi schon vor sich liegen hat? Was ist denn, wenn man einen Text direkt beim Lesen eines Textes zitiert und daher nicht wirklich "sauber" ist, also nicht so klingt als würde man es ablesen?
Hallo Reiner,
das Ergebnis oben haben wir beim ablesen erreicht. Wenn man jetzt unkoordinierter spricht wird das Ergebnis noch schlechter. Je sauberer die Aussprache und klarer die Satzstruktur desto eher erreicht man sinnvolle Ergebnisse.
Wie trainiert man denn die Software, wenn man nicht direkt hineinsprechen kann?
Man spricht einen vorgegebenen Text auf das Gerät auf und überträgt die Datei später zu Dragon!
Wie ist die Qualität der Spracherkennung, wenn man einen Vortrag aufnimmt (immer nur von ein und derselben Person), in dem also Pausen gemacht werden, auch mal leise gesprochen wird, auch sprachliche Gewohnheiten (z.B. rollendes Rrrr) usw. vorkommen?
Und macht es einen Unterschied, ob eine Frau oder ein Mann spricht?
Bitte noch eine Frage:
Ist die Dragon Software auch für Apple System geeignet?
Hallo Himmelblau,
Spracherkennung ist für Vorträge absolut ungeeignet. Das Mikrofon sollte direkt vor dem Mund platziert sein, die Lautstärke darf nicht variieren.
Für Mac wird auch die Technik von Dragon genutzt und nennt sich dort DragonDictate.
Gibt es eine Möglichkeit, die Audiodatei einer iphone App wie beispielsweise Dictamus in Dragon zu übertragen und dann zu transkribieren?
Sie meinen automatisch in Text wandeln lassen? Ja das gibt es, mit Dragon Naturally 11 (in der richtigen Version, die die auch mp3 daten umwandeln kann). Die Erkennungsrate unterliegt aber den gleichen Problemen wie bereits bekannt.
Viele Grüße
Thorsten Dresing
Kommentar hinzufügen