| Spracherkennung | |
| http:/www.lv1.ifkomhessen.de/spracherkenn.htm#S1 | |
Die Spracherkennung wird schon
seit etlichen Jahren technisch beherrscht. Sie erforderte lange Zeit eine
an den Sprecher angepaßte Eingabelogik und große Disziplin des
Sprechers. Seit geraumer Zeit werden Programme angeboten, die ein Eingabetraining
vorsehen und dann die Umsetzung von gesprochenen Wörtern in Text erlauben. Bei
funktionieremdem Programm kann eine disziplinierte gesprochene
Eingabe zur Erzeugung von Texten langwieriges Scannen ersparen.
Die Bedienungsmöglichkeiten sind oft noch nicht optimal.
Weitere Meldungen
Weitere Quellen
Siehe auch Sprachausgabe
Infos - Häufige Fragen (Quelle
siehe unten)
Was machen Spracherkennungsprogramme?
Spracherkennungsprogramme nehmen die Stimme ihres Benutzers
mit einem Mikrofon auf und verwandeln die gesprochenen Worte in Text. Der
Text erscheint entweder in einem speziellen Fenster des Programms oder in einer anderen
Windows- Anwendung und kann beliebig weiterverarbeitet werden. Mit manchen Programmen kann
man in alle Windows-Anwendungen hinein diktieren, mit anderen nur in deren eigene Fenster.
Um die Stimme aufzunehmen, trägt man üblicherweise ein Mikrofon
(ein sogenanntes "Headset") auf dem Kopf, über das die Sprache aufgenommen
wird. Ein solches Mikrofon liegt den meisten Programmen bei. Dadurch, daß man das
Mikrofon am Kopf trägt, bleiben die Hände frei, so dass man mit ihnen
zum Beispiel gleichzeitig die Maus bedienen und in Unterlagen blättern
kann.
Wie geht die Arbeit mit den
Programmen vor sich
Bei fast allen Programmen ist es notwendig, vor der ersten Benutzung
das Programm an die eigene Stimme zu gewöhnen. Man nennt dies "Training".
Dazu liest man zwischen 20 und 60 Minuten lang Texte vor, die einem das Programm auf
dem Bildschirm präsentiert. Manche Programme erlauben es einem auch, ohne dieses
anfängliche Training zu arbeiten, aber für gewöhnlich machen sie dann erheblich mehr
Fehler. Nach dem Training brauchen die Programme dann gewöhnlich etwa 1/2 Stunde,
um die gewonnenen Daten zu verrechnen. Danach kann man mit dem Diktieren beginnen,
und die Fehlerquote sollte zwischen 5 und 10 falschen Wörtern auf 100 gesprochene Wörter
liegen.
Weiter verbessern kann man diese Leistung bei praktisch allen Programmen
durch die Verwendung von Hilfsmitteln wie der sogenannten
"Vokabularerweiterung". Diesen Programmen gibt man eine Liste von schon zuvor
geschriebenen Texten mit. Diese Texte werden dann vom Programm verarbeitet,
und alle darin gefunden Wörter, die das Programm noch nicht kannte, werden dem Wortschatz
des Programms hinzugefügt. Außerdem lernen die Programme so, welche Formulierungen man
am häufigsten benutzt und erkennen diese dann zuverlässiger. So kann die Fehlerquote
typischerweise auf 3 bis 8 falsch erkannte
Wörter von 100 gesenkt werden.
Bei der Behandlung der dann noch auftretenden Fehler unterscheiden sich
die Programme sehr stark: Bei manchen Programmen ist es notwendig, die falsch
erkannten Worte mit der Maus auszuwählen und dann per Tastatur zu
korrigieren, bei anderen kann auch dies vollkommen sprachgesteuert
erfolgen. ein typischer Befehl zum Korrigieren lautet dann zum Beispiel: "Markiere
Taste Uhr - Schreib das T A S T A T U R". Desweiteren bieten einige Programme die
Möglichkeit, mit Hilfe von Sprache auch Anwendungen zu öffnen und schließen und
Programm-Dialoge zu bedienen. So ist es beispielsweise auch für Menschen, die ihre Hände
zum Bedienen des Computers nicht benutzen können möglich, ohne Einschränkungen zu
arbeiten.
Was heißt "diskretes" und "kontinuierliches" Diktieren?
Unter diskretem Diktieren versteht man eine Sprechweise,
bei der jedes Wort einzeln ausgesprochen wird. Es wird also nach dem
Sprechen jedes Wortes eine kleine Pause von einigen Zehntelsekunden
gemacht, Bis vor zirka einem Jahr war dies die normale Art, mit Diktierprogrammen zu
sprechen. Mit einiger Übung konnte man zwar die Pausen zwischen den Wörtern sehr weit
reduzieren, so daß sie ihn für ungeübte Ohren kaum noch zu hören waren,
dennoch bedeutete diese Art des Diktierens für die meisten Menschen eine große
Anstrengung.
Mittlerweile unterstützen fast alle Programme das sogenannte kontinuierliche
Diktieren, bei den zwischen den Wörtern keinerlei Pausen mehr gemacht werden müssen.
Deswegen wird dieser Modus auch oft als "natürliches Diktieren" oder
"natürlicher Sprechrhythmus" bezeichnet. Hier wird also fast wie im Alltag
gesprochen, lediglich auf eine einigermaßen deutliche Aussprache muß
ein wenig mehr geachtet werden als bei der Unterhaltung mit einem
Menschen.
Produkte
Auszug aus http://www.diktatstarten.de
(gefunden mit Suchmaschine und Suchwort
"Spracherkennung")
Während es noch vor zwei Jahren für unmöglich gehalten wurde, natürliche
Spracherkennung noch in diesem Jahrhundert allgemein zugänglich und bezahlbar zu machen,
sind mittlerweile Computer und Programme erheblich weiterentwickelt worden:
Spracherkennung ist heute mit fast jedem Computer möglich.
Falls Sie sich im Rhein-Main-Gebiet befinden, können wir Ihnen auch unseren
Komplett-Service anbieten: Installation der Software (und ggfs. Soundkarte / Mikrofon) bei
Ihnen vor Ort und Einweisung in die Benutzung der Software sowie einige wertvolle
Hinweise, die sie innerhalb weniger Stunden in die Lage versetzen, optimal mit unseren
Programmen zu arbeiten. So vermeiden Sie Startschwierigkeiten oder Installationsprobleme
und haben gleich zu Beginn kompetente Hilfe vor Ort - Ideal für alle, die keine Zeit
haben, sich mit diesen unannehmlichen Kleinigkeiten auseinanderzusetzen. Fragen Sie
einfach nach einem unverbindlichen Angebot - vielleicht wird Ihre Tastatur ja schon in
einigen Tagen zum Staubfänger.
Bestellungen und Anfragen von Produkten zur Spracheingabe
Bei uns (info@DiktatStarten.de)
können Sie fast alle Produkte bestellen, die mit Spracherkennung auf dem PC zu tun haben.
Wir versenden per Nachnahme oder nach Vorauskasse. Demnächst können Sie
auch per Kreditkarte bezahlen. Anfragen und Bestellungen können Sie bequem mit unserem
Formular erledigen.
Falls Sie sich im Rhein-Main-Gebiet befinden, können wir Ihnen auch unseren Komplett-Service
anbieten: Installation der Software (und ggfs. Soundkarte / Mikrofon) bei
Ihnen vor Ort und Einweisung in die Benutzung der Software sowie einige wertvolle
Hinweise, die sie innerhalb weniger Stunden in die Lage versetzen, optimal mit unseren
Programmen zu arbeiten. So vermeiden Sie Startschwierigkeiten oder Installationsprobleme
und haben gleich zu Beginn kompetente Hilfe vor Ort
- Ideal für alle, die keine Zeit haben, sich mit diesen unannehmlichen Kleinigkeiten
auseinanderzusetzen. Fragen Sie einfach nach einem unverbindlichen Angebot - vielleicht
wird Ihre Tastatur ja schon in einigen Tagen zum Staubfänger..
Unser Sortiment:
Artikel
Preis (DM brutto)
Dragon Systems NaturallySpeaking 3.5 Preferred
379,-
Dragon Systems Point&Speak 3.5
99,-
Dragon Systems NaturallySpeaking 3.5 Standard
189,-
Dragon Systems NaturallySpeaking 3.5 Professional 1259,-
Dragon Systems NaturallySpeaking Developer Suite
1279,-
NaturallySpeaking 2.02
30-Tage-Testversion (D, UK, USA, I, F,E)
15,-
Dragon Systems NaturallySpeaking 2.02
Personal (Restexemplare)
119,-
Dragon Systems DragonDictate 3.0 Classic
279,-
IBM ViaVoice98 Home Edition
109,-
IBM ViaVoice98 Executive Edition
359,-
IBM ViaVoice98 Executive Edition Upgrade
179,-
Lernout & Hauspie VoiceXpress Standard
109,-
Lernout & Hauspie VoiceXpress Advanced
229,-
Lernout & Hauspie VoiceXpress Professional
339,-
Philips FreeSpeech98
85,-
Philips FreeSpeech98 + Speechmike Bundle
189,-
G-Data Power Dictate 2002
85,-
Mikrofone
Andrea NC-80
49,-
Andrea NC-50
85,-
Andrea ANC-100
129,-
Andrea ANC-200
129,-
Andrea ANC-500
139,-
Andrea ANC-600
169,-
Andrea ANC-650
179,-
Andrea APS-100 Power Supply
39,-
Philips Speechmike
149,-
Philips Speechmike Pro
bitte
anfragen!
VXI Parrott 10-3 (Level 3)
159,-
Soundblaster Live! Value PCI
199,-
Soundblaster AWE 64 PnP Gold (ISA)
259,-
Diamond S90
69,-
Turtle Beach Montego
229,-
Turtle Beach Fiji
599,-
Falls Sie ungeduldig sind.. ..kein Problem! Die meisten hier genannten Artikel sind
sofort lieferbar. Sollte ein Artikel gerade nicht am Lager sein, können wir ihn innerhalb
weniger Tage besorgen.
Wir versenden per Post oder German Parcel. Die Lieferzeit beträgt im Normalfall
1-3 Tage.
Privatpersonen zahlen per Vorkasse oder Nachnahme, bei größeren
Unternehmen und öffentlichen Institutionen ist auch Lieferung auf Rechnung möglich.
Nach dem Kauf..
.... assen wir Sie als Kunde bei Problemen selbstverständlich nicht
im Regen stehen. Wir möchten, daß die bestellten Komponenten bei Ihnen einwandfrei mit
Ihrem bestehenden System zusammenarbeiten.
Sie können uns z.B. gerne vor einer Bestellung Ihre aktuelle Systemkonfiguration
mitteilen: So können wir Ihnen schon vorab sagen, ob bei den Produkten, die Sie im Auge
haben, etwaige Besonderheiten zu beachten sind. Diesen Service können wir als
Spezialisten Ihnen bieten - ob andere es auch können, entscheiden Sie am besten selbst..
Sie können sich bei Problemen mit den bei uns bestellten Produkten auch später
per E-Mail an uns wenden, um kompetenten Rat bekommen.
Formular für Bestellungen und Anfragen siehe Webseite http://www.diktatstarten.de
Fragen oder Kommentare? Wir freuen uns auf Ihr Feedback an info@DiktatStarten.de
Voice Office 98
Auszug aus com!online 2/99, S. 116
Voice Office von Linguatec (198,-- DM) setzt auf einer Version der
IBM-Spracherkennungs-Software Via Voice Gold auf und bereichert diesen
Kern um Makros zum Steuern und Nutzen von Windows-Desktop, MS-Word ab 7.0 (mit Word
Makros) und anderen Programmen. Installation und Einlesen des Benutzer-Stimmprofils sind
gründlich und für den Anwender problemlos. Tolerant verhielt sich das
Programm gegenüber nuschelnden, in leichtem Dialekt sprechenden Test-Anwendern, etwas empfindlicher
reagierte es auf Nebengeräusche. Ob die Spracheingabe erkannt wird, hängt davon ab, ob
der Nutzer stes gleichmäßig spricht. Da Spracherkennung und großes Vokabular (64 000
Wortformen aktiv / 320 000 passiv) Leistung und Speicher fressen, läuft Voice Office
nur mit Pentium-CPU ab 166 MHz oder 150-MHz-MMX. Trotz der Vorzüge von Voice Office ist
Spracherkennung noch zu umständlich, um Usern Zeit und Mühe zu sparen.
Siehe auch http://www.linguatex.de
Andere Spracherkennungsprogramme: (an
anderen Stellen gefunden;
jeweils letzte Version müßte man feststellen, siehe auch obige Liste)
(DragonDictate für Windows 2.2)
Via Voice Executive 98
IBM VoiceType Navigator 3.02 für Windows 95
Siehe auch http://www.linguatec.de
Spracherkennung im Internet
Auszug aus Internet
Magazin, 3-99, Seite 14
Der weltgrößte Internet-Provider AOL vermarktet in Zukunft die Produkte des
Marktführers im Bereich Spracherkennungstechnologie, Dragon Systems Inc. Dadurch soll der
Anpassungsprozeß der Sprachtechnologie für das Internet beschleunigt werden.
Siehe http://www.dragonsys.com
Siehe http://www.aol.de
Siehe auch "Computer zum Diktat", com!online, Heft 8/99, Seite 58, Auszug hieraus
| Pro | Contra |
| Spracherkennungs-Software ist eine echte Alternative
zur Tastatur. Ich diktiere schon seit Jahren Computer-Fachbüher mit Dragon
Naturally Speaking. Um Erkennungsraten über 95% zu erreichen, muß mn allerdings viel
Zeit ins Programmtraining investieren. Insbesondere in der Anfangsphase sollten die
Diktate sorgfältig korrigiert werden. Spätere Erfolgserlebnisse entschädigen den Nutzer
für den anfänglichen Arbeitsaufwand. Jorge Steffen, Autor und Web-Publisher |
"Mit 540 Anschlägen pro Minute bin ich dreimal
schneller als das flotteste PC-Diktiersystem. Ich tippe Manuskripte von Medizinern,
Juristen und anderen Spezialisten. Da bräuchte ich jahrelang, um meinen Rechner die
diversen Fachwortschätze beizubringen. Wenn ich erkältet bin, versteht mich die Software
gar nicht mehr und produziert Systemabstürze. - Der schmale Grat zum Wahnsinn. Mit
Spracherkennung ist er schnell überschritten." Vera Monz, Texterin im Satzlabor |
Weitere
Meldungen
Internet mit Spracherkennung - Der Browser
hört aus Wort
Siehe Internet magazin, Heft 9/99, Seite
78
. . . . Spezial-Browser werden in Zukunft mit
Spracherkennungs-Komponenten ausgestattet sein. . . . .
Newsflash 33/99
Online im Auto
Der US-Konzern General Motors baut einen Wagen mit
sprachgesteuertem Internet-Zugang. Der Pkw, wahrscheinlich ein Cadillac-Modell, soll bis
Ende nächsten Jahres auf den Markt kommen. Mit dem von General Motors entwickelten System
OnStar soll der Internet-Zugang ueber Satellit hergestellt
werden. Zum Angebot gehören das Auffinden von gestohlenen
Fahrzeugen, Routenplanung und Navigation. Das Aufschliessen des Autos soll auch dann
möglich sein, wenn der Schlüssel weg ist. Wenn sich der Airbag öffnet, wird automatisch
ein Rettungsdienst benachrichtigt. Der Internet-Wagen ist Teil einer
neuen Strategie, die General Motors zu einem "globalen E-Business- Unternehmen"
machen soll.
* Mobil Surfen mal anders
--> http://www.gm.com/
Auszug
aus Computerzeitung, Nr. 29/2001
Die Spracherkennungstechnik bricht zu neuen
Horizonten auf
Die Spracherkennungstechnik erobert neue Anwendungsfelder jenseits des PCs. Vor allem Voice-basierte
Callcenter-Systeme und Voice-Portals
stehen hoch im Kurs.
. . . . .
Systeme verstehen auch ganze Sätze
. . . . .
Voice-Browser surfen freihändig
. . . . .
Die Voice-Technologie löst sich vom PC und zieht in
Kundenmanagementsoftware oder Handys ein.
Heute/T-Online,
29.11.2001
Der Computer lernt Hören und Verstehen
»Computer! Ebene-B-Diagnose« - Jeder Science-Fiction-Freund kennt die
zackige Anrede, die den Kommandos an den Bordrechner des Raumschiffs Enterprise
vorausgeht. Computer, die Sprache verstehen und umsetzen können, sind keine
Utopie mehr. Für Fortschritte auf diesem Gebiet ist ein Wissenschaftler des
Forschungszentrum für Künstliche Intelligenz für den Zukunftspreis
nominiert worden.
http://www.heute.t-online.de/ZDFheute/artikel/0,1251,HOME-0-7367,00.html
CHIP-News,
01.102.2002
CHIPtv: Sprachsteuerung für den PC - es
klappt!
Endlich gehorcht Ihr PC aufs Wort. CHIPtv stellt
eine neue Spracherkennung und -steuerung vor.
http://www.chip.de/news_stories/news_stories_8640674.html
ZDNet, 04.09.2002
Neuer Anlauf für Spracheingabe
Die Tagung "Mensch und Computer" in
Hamburg stellt neuste Entwicklungen vor
http://www.zdnet.de/c/01.cgi?C01t?2121718?020903184245
Auszug aus c`t Heft
3/2003
Sprechen Sie jetzt!
Spracherkennung auf dem PC
Wer ständig mit seinem Rechner spricht, ist entweder ziemlich urlaubsreif oder
glücklicher Besitzer einer Diktatsoftware. Die übernimmt sämtliche
Tipparbeiten und ist auch beim Surfen oder Mailen behilflich.
. . . .
Justiz sagt leise
"Servus" zu ihren Schreibkräften
DEUTSCHE RICHTER BEGEISTERN SICH AN ELEKTRONISCHER SPRACHERKENNUNG
http://www.silicon.de/nl.php?id=177262
Auszug aus com!, 05/2004
Sprechen statt tippen
Sie ersetzen zwar keine echte Sekretärin, dennoch unterstützen Spracherkennungssysteme
für Windows-PCs vor allem Vielschreiber und steigern ihre Produktivität
um ein Vielfaches.
. . . .
Informationsd Wissenschaft -
idw - Pressemitteilung- Fraunhofer-Institut für Arbeitswirtschund
Organisation IAO, 14.05.2004
Mit Computern sprechen: Sprachapplikationen
im Test
Fraunhofer IAO hat eine unabhängige Studie über die Akzeptanz
und Benutzerfreundlichkeit von Sprachapplikationen erstellt. Die Ergebnisse zeigen, welche
Anforderungen Anwender und Kunden an eine gelungene Sprachapplikation stellen.
Sprache bietet viele Vorteile für die Kommunikation zwischen Mensch und
Technik. Anstatt seine Ziele und Bedürfnisse in Menüs und Mausklicks zu
"übersetzen", kann man direkt sagen, was man will. Sprachappli- kationen
existieren bereits in vielen Bereichen. Doch im deutschsprachigen Raum werden die
wirtschaftlichen und technologischen Potenziale von Sprachanwendungen kaum genutzt. Fraunhofer IAO hat eine unabhängige
Studie über die Akzeptanz und Benutzerfreundlichkeit von Sprachapplikationen aus
Kundensicht erstellt. Die Publikation zeigt, welche Anforderungen
Anwender und Kunden an eine gelungene Sprach- anwendung stellen.
Fraunhofer IAO hat sowohl das allgemeine Verhalten als auch spezifische Gewohnheiten bei
der Nutzung von Sprache analysiert und transparent dargestellt. Auf Basis einer
umfangreichen telefoni- schen Befragung mit mehr als 1000 Teilnehmern
bietet die Studie einen Überblick über die allgemeine Akzeptanz von Sprachapplikationen.
Weiterhin greift die Publikation folgende Fragestellungen auf:
Welche Faktoren beeinflussen die Akzeptanz und
Benutzerfreundlichkeit,welche davon sind kritisch?
Welche positiven bzw. negativen Erfahrungen haben Kunden
mitSprachapplikationen?
Was sind Vor- und Nachteile von Sprachapplikationen im
Vergleich zuanderen Interaktionsformen aus
Kunden- und Anbietersicht?
Was macht eine erfolgreiche Sprachapplikation aus?
Anwendertests mit repräsentativen Teilnehmern bildeten die Grundlage,
um ausgewählte Applikationen zu bewerten und relevante Aspekte für deren ergonomisches
Design zu identifizieren. Die Studie erscheint Ende Mai 2004 und ist zum
Preis von 150 Euro im IAO-Shop unter www.iao.fraunhofer .de/d/shop
erhältlich.
Weitere Informationen finden Sie unter:
http://www.hci.iao.fhg.de
http://www.iao.fraunhofer.de/d/shop
Auszug aus c´t Heft
3/2007
Zum Diktat
Die Spracheingabe von Windows Vista tritt gegen etablierte
Diktiersysteme an
Bisher teilten sich Voice Pro und Dragon Naturally Speaking den
Markt der deutschen Einzelplatz-Diktiersoftware. doch nun meldet sich ernst zu nehmende
Kokurrenz: Windows Vista überrascht mit einer eingebauten lösung zum Texten und Bedienen
ohne Tastatur und Maus, die sich sehen lassen kann.
. . . .
Weitere
Quellen
Siehe auch Übersetzungen.
| |
|
| Kommentare stets erwünscht an Webmaster | Modifiziert:
26.02.07 / Ti |