Spracherkennung          sym_home_a.gif (82 Byte)  Zurück zur Homepage  AG00108_.gif (1629 Byte)
http:/www.lv1.ifkomhessen.de/spracherkenn.htm#S1   AG00088_.gif (337 Byte)  Zurück zur Auswahl



Die Spracherkennung wird schon seit etlichen Jahren technisch beherrscht. Sie erforderte lange Zeit eine an den Sprecher angepaßte Eingabelogik und große Disziplin des Sprechers. Seit geraumer Zeit werden Programme angeboten, die ein Eingabetraining vorsehen und dann die Umsetzung von gesprochenen Wörtern in Text erlauben. Bei funktionieremdem Programm kann eine disziplinierte gesprochene Eingabe zur Erzeugung von Texten langwieriges Scannen ersparen.
Die Bedienungsmöglichkeiten sind oft noch nicht optimal.

Weitere Meldungen  
Weitere Quellen                 Siehe auch Sprachausgabe


Infos - Häufige Fragen (Quelle siehe unten)
Was machen Spracherkennungsprogramme?
Spracherkennungsprogramme nehmen die Stimme ihres Benutzers mit einem Mikrofon auf und verwandeln die gesprochenen Worte in Text. Der Text erscheint entweder in einem speziellen Fenster des Programms oder in einer anderen Windows- Anwendung und kann beliebig weiterverarbeitet werden. Mit manchen Programmen kann man in alle Windows-Anwendungen hinein diktieren, mit anderen nur in deren eigene Fenster.
Um die Stimme aufzunehmen, trägt man üblicherweise ein Mikrofon (ein sogenanntes "Headset") auf dem Kopf, über das die Sprache aufgenommen wird. Ein solches Mikrofon liegt den meisten Programmen bei. Dadurch, daß man das Mikrofon am Kopf trägt, bleiben die Hände frei, so dass man mit ihnen zum Beispiel gleichzeitig die Maus bedienen und in Unterlagen blättern kann.

top.gif (86 Byte)

Wie geht die Arbeit mit den Programmen vor sich 
Bei fast allen Programmen ist es notwendig, vor der ersten Benutzung das Programm an die eigene Stimme zu gewöhnen. Man nennt dies "Training". Dazu liest man zwischen 20 und 60 Minuten lang Texte vor, die einem das  Programm auf dem Bildschirm präsentiert. Manche Programme erlauben es einem auch, ohne dieses anfängliche Training zu arbeiten, aber für gewöhnlich machen sie dann erheblich mehr Fehler. Nach dem Training brauchen die Programme dann gewöhnlich etwa 1/2 Stunde,  um die gewonnenen Daten zu verrechnen.  Danach kann man mit dem Diktieren beginnen, und die Fehlerquote sollte zwischen 5 und 10 falschen Wörtern auf 100 gesprochene Wörter liegen.
Weiter verbessern kann man diese Leistung bei praktisch allen Programmen durch die Verwendung von Hilfsmitteln wie der sogenannten "Vokabularerweiterung". Diesen Programmen gibt man eine Liste von schon zuvor   geschriebenen Texten mit. Diese Texte werden dann vom  Programm verarbeitet, und alle darin gefunden Wörter, die das Programm noch nicht kannte, werden dem Wortschatz des Programms hinzugefügt. Außerdem lernen die Programme so, welche Formulierungen man am häufigsten benutzt und erkennen diese dann zuverlässiger. So kann die Fehlerquote typischerweise auf 3 bis 8 falsch erkannte
Wörter von 100 gesenkt werden.
Bei der Behandlung der dann noch auftretenden Fehler unterscheiden sich die Programme sehr stark: Bei manchen  Programmen ist es notwendig, die falsch erkannten Worte mit der Maus auszuwählen und dann per Tastatur zu korrigieren, bei anderen kann auch dies vollkommen sprachgesteuert erfolgen. ein typischer Befehl zum Korrigieren lautet dann zum Beispiel: "Markiere Taste Uhr - Schreib das T A S T A T U R". Desweiteren bieten einige Programme die Möglichkeit, mit Hilfe von Sprache auch Anwendungen zu öffnen und schließen und Programm-Dialoge zu bedienen. So ist es beispielsweise auch für Menschen, die ihre Hände zum Bedienen des Computers nicht benutzen können möglich, ohne Einschränkungen zu arbeiten.
Was heißt "diskretes" und "kontinuierliches" Diktieren?
Unter diskretem Diktieren versteht man eine Sprechweise,  bei der jedes Wort einzeln ausgesprochen wird. Es wird also nach dem Sprechen jedes Wortes eine kleine Pause von einigen Zehntelsekunden gemacht, Bis vor zirka einem Jahr  war dies die normale Art, mit Diktierprogrammen zu sprechen. Mit einiger Übung konnte man zwar die Pausen zwischen den Wörtern sehr weit reduzieren, so daß sie ihn  für ungeübte Ohren kaum noch zu hören waren,  dennoch bedeutete diese Art des Diktierens für die meisten Menschen eine große Anstrengung.
Mittlerweile unterstützen fast alle Programme das sogenannte kontinuierliche Diktieren, bei den zwischen den Wörtern keinerlei Pausen mehr gemacht werden müssen. Deswegen wird dieser Modus  auch oft als "natürliches Diktieren" oder "natürlicher Sprechrhythmus" bezeichnet. Hier wird also fast wie im Alltag gesprochen, lediglich auf eine einigermaßen deutliche Aussprache muß ein wenig mehr geachtet werden als bei der Unterhaltung mit einem Menschen.

top.gif (86 Byte)


Produkte
Auszug aus 
http://www.diktatstarten.de       (gefunden mit Suchmaschine und Suchwort "Spracherkennung")
Während es noch vor zwei Jahren für unmöglich gehalten wurde, natürliche Spracherkennung noch in diesem Jahrhundert allgemein zugänglich und bezahlbar zu machen, sind mittlerweile Computer und Programme erheblich weiterentwickelt worden: Spracherkennung ist heute mit fast jedem Computer möglich.
Falls Sie sich im Rhein-Main-Gebiet befinden, können wir Ihnen auch unseren Komplett-Service anbieten: Installation der Software (und ggfs. Soundkarte / Mikrofon) bei Ihnen vor Ort und Einweisung in die Benutzung der Software sowie einige wertvolle Hinweise, die sie innerhalb weniger Stunden in die Lage versetzen, optimal mit unseren Programmen zu arbeiten. So vermeiden Sie Startschwierigkeiten oder Installationsprobleme und haben gleich zu Beginn kompetente Hilfe vor Ort - Ideal für alle, die keine Zeit haben, sich mit diesen unannehmlichen Kleinigkeiten auseinanderzusetzen. Fragen Sie einfach nach einem unverbindlichen Angebot - vielleicht wird Ihre Tastatur ja schon in einigen Tagen zum Staubfänger.
Bestellungen und Anfragen  von Produkten zur Spracheingabe
Bei uns  (info@DiktatStarten.de) können Sie fast alle Produkte bestellen, die mit Spracherkennung auf dem PC zu tun haben. Wir versenden per Nachnahme oder nach Vorauskasse. Demnächst können Sie auch per Kreditkarte bezahlen. Anfragen und Bestellungen können Sie bequem mit unserem Formular erledigen.
Falls Sie sich im Rhein-Main-Gebiet befinden, können wir Ihnen auch unseren Komplett-Service anbieten: Installation der Software (und ggfs. Soundkarte / Mikrofon) bei Ihnen vor Ort und Einweisung in die Benutzung der Software sowie einige wertvolle Hinweise, die sie innerhalb weniger Stunden in die Lage versetzen, optimal mit unseren Programmen zu arbeiten. So vermeiden Sie Startschwierigkeiten oder Installationsprobleme und haben gleich zu Beginn kompetente Hilfe vor Ort
- Ideal für alle, die keine Zeit haben, sich mit diesen unannehmlichen Kleinigkeiten auseinanderzusetzen. Fragen Sie einfach nach einem unverbindlichen Angebot - vielleicht wird Ihre Tastatur ja schon in einigen Tagen zum Staubfänger..

top.gif (86 Byte)

Unser Sortiment:
Artikel                                                                                    Preis (DM  brutto)
Dragon Systems NaturallySpeaking 3.5 Preferred          379,-
Dragon Systems Point&Speak 3.5                                   99,-
Dragon Systems NaturallySpeaking 3.5 Standard                   189,-
Dragon Systems NaturallySpeaking 3.5 Professional      1259,-
Dragon Systems NaturallySpeaking Developer Suite       1279,-
NaturallySpeaking 2.02
   30-Tage-Testversion (D, UK, USA, I, F,E)                       15,-
Dragon Systems NaturallySpeaking 2.02
   Personal (Restexemplare)                                            119,-
Dragon Systems DragonDictate 3.0 Classic                      279,-
IBM ViaVoice98 Home Edition                                         109,-
IBM ViaVoice98 Executive Edition                                    359,-
IBM ViaVoice98 Executive Edition Upgrade                       179,-
Lernout & Hauspie VoiceXpress Standard                          109,-
Lernout & Hauspie VoiceXpress Advanced                         229,-
Lernout & Hauspie VoiceXpress Professional                     339,-
Philips FreeSpeech98                                                       85,-
Philips FreeSpeech98 + Speechmike Bundle                     189,-
G-Data Power Dictate 2002                                                85,-
Mikrofone
Andrea NC-80                                                            49,-
Andrea NC-50                                                            85,-
Andrea ANC-100                                                     129,-
Andrea ANC-200                                                     129,-
Andrea ANC-500                                                     139,-
Andrea ANC-600                                                     169,-
Andrea ANC-650                                                     179,-
Andrea APS-100 Power Supply                                  39,-
Philips Speechmike                                                 149,-
Philips Speechmike Pro                                          bitte anfragen!
VXI Parrott 10-3 (Level 3)                                         159,-
Soundblaster Live! Value PCI                                   199,-
Soundblaster AWE 64 PnP Gold (ISA)                      259,-
Diamond S90                                                            69,-
Turtle Beach Montego                                               229,-
Turtle Beach Fiji                                                      599,-

Falls Sie ungeduldig sind.. ..kein Problem! Die meisten hier genannten Artikel sind sofort lieferbar. Sollte ein Artikel gerade nicht am Lager sein, können wir ihn innerhalb weniger Tage besorgen.
Wir versenden per Post oder German Parcel. Die Lieferzeit beträgt im Normalfall 1-3 Tage.
Privatpersonen zahlen per Vorkasse oder Nachnahme, bei größeren Unternehmen und öffentlichen Institutionen ist auch Lieferung auf Rechnung möglich.

top.gif (86 Byte)

Nach dem Kauf..
.... assen wir Sie als Kunde bei Problemen selbstverständlich nicht im Regen stehen. Wir möchten, daß die bestellten Komponenten bei Ihnen einwandfrei mit Ihrem bestehenden System zusammenarbeiten.
Sie können uns z.B. gerne vor einer Bestellung Ihre aktuelle Systemkonfiguration mitteilen: So können wir Ihnen schon vorab sagen, ob bei den Produkten, die Sie im Auge haben, etwaige Besonderheiten zu beachten sind. Diesen Service können wir als Spezialisten Ihnen bieten - ob andere es auch können, entscheiden Sie am besten selbst..   Sie können sich bei Problemen mit den bei uns bestellten Produkten auch später per E-Mail an uns wenden, um kompetenten Rat bekommen.
Formular für Bestellungen und Anfragen  siehe Webseite http://www.diktatstarten.de
Fragen oder Kommentare? Wir freuen uns auf Ihr Feedback an info@DiktatStarten.de

top.gif (86 Byte)


Voice Office 98
Auszug
aus com!online 2/99, S. 116
Voice Office
von Linguatec (198,-- DM) setzt auf einer Version der IBM-Spracherkennungs-Software Via Voice Gold auf und bereichert diesen Kern um Makros zum Steuern und Nutzen von Windows-Desktop, MS-Word ab 7.0 (mit Word Makros) und anderen Programmen. Installation und Einlesen des Benutzer-Stimmprofils sind gründlich und für den Anwender problemlos. Tolerant verhielt sich das Programm gegenüber nuschelnden, in leichtem Dialekt sprechenden Test-Anwendern, etwas empfindlicher reagierte es auf Nebengeräusche. Ob die Spracheingabe erkannt wird, hängt davon ab, ob der Nutzer stes gleichmäßig spricht. Da Spracherkennung und großes Vokabular (64 000 Wortformen aktiv / 320 000 passiv) Leistung und Speicher fressen, läuft Voice Office nur mit Pentium-CPU ab 166 MHz oder 150-MHz-MMX. Trotz der Vorzüge von Voice Office ist Spracherkennung noch zu umständlich, um Usern Zeit und Mühe zu sparen.
Siehe auch http://www.linguatex.de

top.gif (86 Byte)


Andere Spracherkennungsprogramme: (an anderen Stellen gefunden;
                                                                                        jeweils letzte Version müßte man feststellen, siehe auch obige Liste)
(DragonDictate für Windows 2.2)
Via Voice Executive 98
IBM VoiceType Navigator 3.02 für Windows 95
Siehe auch http://www.linguatec.de


Spracherkennung im Internet
Auszug
aus Internet Magazin, 3-99, Seite 14
Der weltgrößte Internet-Provider AOL vermarktet in Zukunft die Produkte des Marktführers im Bereich Spracherkennungstechnologie, Dragon Systems Inc. Dadurch soll der Anpassungsprozeß der Sprachtechnologie für das Internet beschleunigt werden.
Siehe http://www.dragonsys.com
Siehe http://www.aol.de

top.gif (86 Byte)


Siehe auch "Computer zum Diktat", com!online, Heft 8/99, Seite 58, Auszug hieraus

Pro Contra
Spracherkennungs-Software ist eine echte Alternative zur Tastatur. Ich diktiere schon seit Jahren Computer-Fachbüher mit Dragon Naturally Speaking. Um Erkennungsraten über 95% zu erreichen, muß mn allerdings viel Zeit ins Programmtraining investieren. Insbesondere in der Anfangsphase sollten die Diktate sorgfältig korrigiert werden. Spätere Erfolgserlebnisse entschädigen den Nutzer für den anfänglichen Arbeitsaufwand.
Jorge Steffen, Autor und Web-Publisher
"Mit 540 Anschlägen pro Minute bin ich dreimal schneller als das flotteste PC-Diktiersystem. Ich tippe Manuskripte von Medizinern, Juristen und anderen Spezialisten. Da bräuchte ich jahrelang, um meinen Rechner die diversen Fachwortschätze beizubringen. Wenn ich erkältet bin, versteht mich die Software gar nicht mehr und produziert Systemabstürze. - Der schmale Grat zum Wahnsinn. Mit Spracherkennung ist er schnell überschritten."
Vera Monz, Texterin im Satzlabor
   

top.gif (86 Byte)


Weitere Meldungen
Internet mit Spracherkennung - Der Browser hört aus Wort
Siehe Internet magazin, Heft 9/99, Seite 78
. . . . Spezial-Browser werden in Zukunft mit Spracherkennungs-Komponenten ausgestattet sein. . . . .


Newsflash 33/99
Online im Auto
Der US-Konzern General Motors baut einen Wagen mit sprachgesteuertem Internet-Zugang. Der Pkw, wahrscheinlich ein Cadillac-Modell, soll bis Ende nächsten Jahres auf den Markt kommen. Mit dem von General Motors entwickelten System OnStar soll der Internet-Zugang ueber Satellit hergestellt werden. Zum Angebot gehören das Auffinden von gestohlenen
Fahrzeugen, Routenplanung und Navigation. Das Aufschliessen des Autos soll auch dann möglich sein, wenn der Schlüssel weg ist. Wenn sich der Airbag öffnet, wird automatisch ein Rettungsdienst benachrichtigt. Der Internet-Wagen ist Teil einer neuen Strategie, die General Motors zu einem "globalen E-Business- Unternehmen" machen soll.
* Mobil Surfen mal anders
--> http://www.gm.com/


Auszug aus Computerzeitung, Nr. 29/2001
Die Spracherkennungstechnik bricht zu neuen Horizonten auf
Die Spracherkennungstechnik erobert neue Anwendungsfelder jenseits des PCs. Vor allem Voice-basierte Callcenter-Systeme und Voice-Portals stehen hoch im Kurs.

. . . . .
Systeme verstehen auch ganze Sätze
. . . . .
Voice-Browser surfen  freihändig
. . . . .
Die Voice-Technologie löst sich vom PC und zieht in Kundenmanagementsoftware oder Handys ein.

top.gif (86 Byte)


Heute/T-Online, 29.11.2001
Der Computer lernt Hören und Verstehen
»Computer! Ebene-B-Diagnose« - Jeder Science-Fiction-Freund kennt die zackige Anrede, die den Kommandos an den Bordrechner des Raumschiffs Enterprise vorausgeht. Computer, die Sprache verstehen und umsetzen können, sind keine Utopie mehr. Für Fortschritte auf diesem Gebiet ist ein Wissenschaftler des Forschungszentrum für Künstliche Intelligenz für den Zukunftspreis nominiert worden.
http://www.heute.t-online.de/ZDFheute/artikel/0,1251,HOME-0-7367,00.html

top.gif (86 Byte)


CHIP-News, 01.102.2002
CHIPtv: Sprachsteuerung für den PC - es klappt!
Endlich gehorcht Ihr PC aufs Wort. CHIPtv stellt eine neue Spracherkennung und -steuerung vor.
http://www.chip.de/news_stories/news_stories_8640674.html

top.gif (86 Byte)


ZDNet, 04.09.2002
Neuer Anlauf für Spracheingabe
Die Tagung "Mensch und Computer" in Hamburg stellt neuste Entwicklungen vor
http://www.zdnet.de/c/01.cgi?C01t?2121718?020903184245

top.gif (86 Byte)


Auszug aus c`t Heft 3/2003  
Sprechen Sie jetzt!       pfeil_ob.gif (312 Byte)
Spracherkennung auf dem PC
Wer ständig mit seinem Rechner spricht, ist entweder ziemlich urlaubsreif oder glücklicher Besitzer einer Diktatsoftware. Die übernimmt sämtliche Tipparbeiten und ist auch beim Surfen oder Mailen behilflich.
. . . .

top.gif (86 Byte)


Justiz sagt leise "Servus" zu ihren Schreibkräften
DEUTSCHE RICHTER BEGEISTERN SICH AN ELEKTRONISCHER SPRACHERKENNUNG
http://www.silicon.de/nl.php?id=177262


Auszug aus com!, 05/2004
Sprechen statt tippen
Sie ersetzen zwar keine echte Sekretärin, dennoch unterstützen Spracherkennungssysteme für Windows-PCs vor allem Vielschreiber und steigern ihre Produktivität um ein Vielfaches.
. . . .

top.gif (86 Byte)


Informationsd Wissenschaft - idw  - Pressemitteilung- Fraunhofer-Institut für Arbeitswirtschund Organisation IAO, 14.05.2004
Mit Computern sprechen: Sprachapplikationen im Test
Fraunhofer IAO hat eine unabhängige Studie über die Akzeptanz und Benutzerfreundlichkeit von Sprachapplikationen erstellt. Die Ergebnisse zeigen, welche Anforderungen Anwender und Kunden an eine gelungene Sprachapplikation stellen.
Sprache bietet viele Vorteile für die Kommunikation zwischen Mensch und Technik. Anstatt seine Ziele und Bedürfnisse in Menüs und Mausklicks zu "übersetzen", kann man direkt sagen, was man will. Sprachappli- kationen existieren bereits in vielen Bereichen. Doch im deutschsprachigen Raum werden die wirtschaftlichen und technologischen Potenziale von Sprachanwendungen kaum genutzt. Fraunhofer IAO hat eine unabhängige Studie über die Akzeptanz und Benutzerfreundlichkeit von Sprachapplikationen aus Kundensicht erstellt. Die Publikation zeigt, welche Anforderungen Anwender und Kunden an eine gelungene Sprach- anwendung stellen. Fraunhofer IAO hat sowohl das allgemeine Verhalten als auch spezifische Gewohnheiten bei der Nutzung von Sprache analysiert und transparent dargestellt. Auf Basis einer umfangreichen telefoni- schen Befragung mit mehr als 1000 Teilnehmern bietet die Studie einen Überblick über die allgemeine Akzeptanz von Sprachapplikationen. Weiterhin greift die Publikation folgende Fragestellungen auf:
AG00088_.gif (337 Byte) Welche Faktoren beeinflussen die Akzeptanz und Benutzerfreundlichkeit,welche davon sind kritisch?
AG00088_.gif (337 Byte) Welche positiven bzw. negativen Erfahrungen haben Kunden mitSprachapplikationen?
AG00088_.gif (337 Byte) Was sind Vor- und Nachteile von Sprachapplikationen im Vergleich zuanderen Interaktionsformen aus
    Kunden- und Anbietersicht?
AG00088_.gif (337 Byte) Was macht eine erfolgreiche Sprachapplikation aus?
Anwendertests mit repräsentativen Teilnehmern bildeten die Grundlage, um ausgewählte Applikationen zu bewerten und relevante Aspekte für deren ergonomisches Design zu identifizieren. Die Studie erscheint Ende Mai 2004 und ist zum Preis von 150 Euro im  IAO-Shop unter www.iao.fraunhofer .de/d/shop erhältlich.
Weitere Informationen finden Sie unter:
http://www.hci.iao.fhg.de
http://www.iao.fraunhofer.de/d/shop

top.gif (86 Byte)


Auszug aus c´t Heft 3/2007
Zum Diktat
Die Spracheingabe von Windows Vista tritt gegen etablierte Diktiersysteme an
Bisher teilten sich Voice Pro und Dragon Naturally Speaking den Markt der deutschen Einzelplatz-Diktiersoftware. doch nun meldet sich ernst zu nehmende Kokurrenz: Windows Vista überrascht mit einer eingebauten lösung zum Texten und Bedienen ohne Tastatur und Maus, die sich sehen lassen kann.
. . . .

top.gif (86 Byte)


Weitere Quellen
Siehe auch Übersetzungen.


   sym_home_a.gif (82 Byte)  Zurück zur Homepage  AG00108_.gif (1629 Byte)   AG00088_.gif (337 Byte)  Zurück zur Auswahl
                   AG00059_.gif (12001 Byte)                AG00088_.gif (337 Byte) Zurück zum Seitenanfang
   Kommentare stets erwünscht an  Webmaster

Modifiziert:  26.02.07 / Ti   wt-wapp1.jpg (38628 Byte)