[go: up one dir, main page]

DE10213163A1 - Verfahren zur Korrektur von Texten - Google Patents

Verfahren zur Korrektur von Texten

Info

Publication number
DE10213163A1
DE10213163A1 DE2002113163 DE10213163A DE10213163A1 DE 10213163 A1 DE10213163 A1 DE 10213163A1 DE 2002113163 DE2002113163 DE 2002113163 DE 10213163 A DE10213163 A DE 10213163A DE 10213163 A1 DE10213163 A1 DE 10213163A1
Authority
DE
Germany
Prior art keywords
text
language
sender
program
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE2002113163
Other languages
English (en)
Inventor
Christel Mueller
Uwe Nettelroth
Fred Runge
Marian Trinkel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deutsche Telekom AG
Original Assignee
Deutsche Telekom AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deutsche Telekom AG filed Critical Deutsche Telekom AG
Priority to DE2002113163 priority Critical patent/DE10213163A1/de
Publication of DE10213163A1 publication Critical patent/DE10213163A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Verfahren zur automatischen Erstellung einer Datei auf der Grundlage eines gesprochenen Wortes, eines Textes oder eines Textfragmentes, wobei die in die Datei umzuwandelnde Sprache von einem Absender in ein Eingabegerät, das in ein Kommunikationsnetz eingebunden ist, gesprochen wird, wobei ein ebenfalls in das Netz eingebundener Computer vermittels eines Sprachprogrammes die Sprache in die Datei umwandelt und wobei die Datei zur Überarbeitung auf ein empfangendes Endgerät des Absenders, das gleichfalls in das Netz eingebunden ist, zurückgeschickt wird.

Description

  • Die vorliegende Erfindung betrifft ein Verfahren zur automatischen Erstellung einer Datei, beispielsweise einer Zeichenfolge, einer Textdatei oder einer Nachricht, auf der Grundlage eines gesprochenen Wortes, eines gesprochenen Textes oder eines gesprochenen Textfragmentes, wobei die in die Datei umzuwandelnde Sprache von einem Absender in ein Eingabegerät, das in ein Kommunikationsnetz eingebunden ist, gesprochen wird und wobei ein ebenfalls in das Netz eingebundener Computer vermittels eines Sprachprogrammes die Sprache in die Textdatei umwandelt. Die Erfindung betrifft auch ein System zur Durchführung des Verfahrens.
  • Derartige Systeme zur Konvertierung gesprochener Texte sind schon realisiert. So sind nicht automatische Verfahren bekannt, bei denen der Absender seine Sprachnachricht in ein Endgerät eingibt, worauf hin diese digitalisiert und einem Operator zugeführt wird. Der Operator setzt den gesprochenen Text um und verschickt ihn an einen vom Absender angegebenen Empfänger (Adressat).
  • Dieses Verfahren ist wegen des Personalaufwandes langsam, umständlich und kostenintensiv. Es ist jedoch auch schon bekannt, den menschlichen Operator durch einen Computer zu ersetzen. Der vom Computer umgewandelte Text muß jedoch wegen der Unzulänglichkeiten der Sprachanalyseprogramme von einem Operator zeitversetzt zur Korrektur überarbeitet werden, bevor er beispielsweise als SMS-Nachricht oder als E-mail an den Empfänger verschickt wird. Auch dieses System ist noch vergleichsweise aufwendig und verursacht entsprechende Kosten. Außerdem ist bei allen bekannten Verfahren nachteilig, daß der Absender keinerlei Kontrolle über den von ihm entworfenen Text hat.
  • Aufgabe der Erfindung ist es nunmehr, ein gattungsgemäßes Verfahren zu schaffen, das sich mit einfachen und kostengünstigen Mitteln umsetzen läßt und das die zuverlässige Umwandlung eines gesprochenen in eine ausgebbare Datei ermöglicht. Zudem ist es Aufgabe der Erfindung, ein System zur Umsetzung des Verfahrens zu schaffen.
  • Diese Aufgaben werden durch ein Verfahren nach Anspruch 1 und ein System nach Anspruch 9 gelöst.
  • Der wesentliche Grundgedanke der Erfindung liegt darin, die Datei dem Absender zur Überarbeitung, insbesondere zur Korrektur auf sein empfangendes Endgerät, das gleichfalls in das Netz eingebunden ist, zurückzuschicken. Der Absender kann sich also vor der Weiterverarbeitung des Textes von dem korrekt wiedergegebenen Inhalt überzeugen und ihn gegebenenfalls korrigieren. Wegen des Verzichts auf Personal können einerseits erhebliche Kosten gespart und die Geschwindigkeit der Umsetzung andererseits gesteigert werden. Ein weiterer Vorteil des Verfahrens ist, daß es sich mit vorhandenen Mittel einfach umsetzen läßt. So kann insbesondere von einem mit Mikrophon ausgestatteten Endgerät eine Telephonleitung zu einem mit Telephoninterface und Spracherkennung ausgestatteten zentralen Computer (Server) aufgebaut werden, der die erkannten Sprachsignale zum Zwecke der Weitervermittlung in einen lesbaren Text umwandelt. Dabei kann die Verbindung entweder über ein Telephon- oder ein anders Netz (z. B. Internet) aufgebaut werden.
  • Um eine einfache und effiziente Überarbeitung zu ermöglichen, ist es vorteilhaft, wenn das Endgerät des Absenders neben einem Mikrophon zur Spracheingabe eine Tastatur zur manuellen Eingabe von Textzeichen und einen Bildschirm zur visuellen Ausgabe des Textes aufweist. So kann die vollständige Kommunikation von einem einzigen Endgerät vorgenommen werden. Im einfachsten Falle werden die Voraussetzungen von einem mobilen Telephon (Handy, UMTS, PDA o. ä.) erfüllt, über das ein Nutzer eine SMS Nachricht, die er diktiert hat, verschicken möchte. Der umgewandelte Text kann dem Absender nach Beendigung des Diktiervorganges zur Bestätigung und/oder Korrektur auf den Bildschirm (Display) rückübermittelt werden. Der Vorteil der Erfindung liegt auf der Hand: So braucht der Absender nicht eine große Anzahl von Worten selber über die kleine Tastatur eingeben, sondern braucht nur wenige Worte korrigieren. Dies bietet gerade bei der Versendung von SMS über Moiltelephone, deren Bildschirme vergleichsweise klein und die Tastaturen nur bedingt für die Eingabe längerer Texte geeignet sind, große Vorteile. Der Text im SMS Format wird dann auf dem Bildschirm des Mobiltelephons ausgegeben.
  • Wie dargelegt, können als Übertragungsformate die Formate von SMS oder E- mail Nachrichten verwendet werden. Bei diesen Formaten kann die Überarbeitung des Textes einfach über die Tasten des Endgerätes erfolgen. Es ist auch denkbar, scriptbasierte Formate (WML, HTML oder xML) wie z. B. WAP oder Formulare im Internet auszuwählen, die den Inhalt des diktierten Textes darstellen und eine Bestätigung und/oder Korrektur ermöglichen. Erfindungsgemäß ist es nicht nur möglich, den gesprochenen Text in eine entsprechende Datei (z. B. im ASCII- Format) umzuwandeln, es ist auch vorteilhaft, den gesprochenen Text bei der Umwandlung durch das Programm in eine andere Sprache zu übersetzen. Dabei kann auf entsprechende Übersetzungsprogramme zurückgegriffen werden. Ein derart modifiziertes Verfahren bietet eine große Anzahl von Möglichkeiten.
  • Die Erfindung kann derart realisiert sein, daß der gesprochene Text als ganzes aufgenommen, umgewandelt und nach der Umwandlung dem Absender zurückgesandt wird. Dieses Verfahren vermeidet besonders effektiv Kosten, die für die Aufrechterhaltung der Leitung aufzuwenden sind. Falls die Netzgebühren verhältnismäßig gering sind, kann es besonders vorteilhaft sein, die Umwandlung "online" durchzuführen. Dabei können wie bei einem dezentral auf dem PC realisierten Diktierprogramm die umgewandelten Teile der Sprache unmittelbar nach der Umwandlung auf dem Bildschirm dargestellt werden. Die Erfindung manifestiert sich demnach in einer Art zentralem Diktierprogramm. Ein solches zentral organisiertes Programm kann dabei wegen der einfach zur Verfügung zu stellenden großen Rechnerkapazitäten mit besonderen Features ausgestattet werden: So ist es vorteilhaft, wenn der Rechner "lernfähig" ist und sich der Charakteristik eines Absenders flexibel anpassen kann. Dazu können die vom Absender überarbeiteten Teile des Textes an den Computer zurückgesendet werden, die dieser vermittels eines lernfähigen Algorithmus zur Adaption des Programmes an die Charakteristik der Stimme des Absenders verarbeitet. Beim nächsten Diktat wird ein solches Programm schon mehr verstehen als beim ersten mal.
  • Im Falle von SMS oder E-mail Nachrichten ist es vorteilhaft, wenn der Text nach der Überarbeitung durch den Absender direkt durch den zentralen Rechner an einen anderen Adressaten verschickt wird. Im einfachsten Falle wird der Absender die vom Computer erstellte Nachricht einmal zur Kontrolle durchlesen und dann die Richtigkeit bestätigen. Durch die Bestätigung wird die Nachricht an den Adressaten verschickt. Insgesamt ist es vorteilhaft, wenn die vom Programm nicht eindeutig identifizierten Worte im Text markiert werden. So wird der Leser sofort mit den eventuell problematischen Textstellen konfrontiert.
  • Eine vorteilhafte Ausgestaltung der Erfindung ist in der Figur dargestellt und wird nachfolgend näher beschrieben.
  • Die Figur zeigt ein System zur Umsetzung des Verfahrens aufweisend ein Kommunikationsnetz 1, an das Endgeräte wie Telephone 2, Mobiltelephone 3 oder Computer 4 angeschlossen sind. Die Endgeräte sind jeweils mit einem Mikrophon zur Eingabe der Sprache ausgestattet. Der Computer 4 ist zudem an das Internet oder ein Intranet 5 angeschlossen. Die Pfeile beziehungsweise die Doppelpfeile verdeutlichen die Kommunikationswege. An das Netz 1 ist gleichfalls ein zentraler Computer (CT-Server) 6 angeschlossen, auf dem ein Programm zur Sprachkonvertierung in der Art eines Diktiersystems realisiert ist. In dieser Ausführungsform ist der Server 6 zusätzlich an eine interne oder externe Plattform 7 mit Algorithmus zur Spracherkennung angeschlossen. Der Server 6 weist ein Diktier-Modul auf, das dem Programm in einer Sprache zugeführte Textfragmente in eine Textdatei umfassend lesbare Zeichen umwandelt und nach der Umwandlung an das Endgerät des Adressaten zurücksendet. Somit wird die Sprache umgewandelt und in einer Textdatei 8 als Repräsentation des erkannten Textes 8 dargestellt. Die Datei wird entweder über das Netz 1 zu einem Endgerät oder im Falle des Computers 4 über das Internet an den Absender zur Überarbeitung zurückgeschickt. Dabei ist es selbstverständlich auch möglich, daß der Absender sich zur Eingabe eines Telephons 2 oder 3 bedient und die Rückantwort auf seine PC 4 bekommt. Nach der Bestätigung durch den Absender wird der Text zu einem Adressaten 9 gesendet.

Claims (10)

1. Verfahren zur automatischen Erstellung einer Datei auf der Grundlage eines gesprochenen Wortes, eines Textes oder eines Textfragmentes, wobei die in die Datei umzuwandelnde Sprache von einem Absender in ein Eingabegerät, das in ein Kommunikationsnetz eingebunden ist, gesprochen wird und wobei ein ebenfalls in das Netz eingebundener Computer vermittels eines Sprachprogrammes die Sprache in die Datei umwandelt, dadurch gekennzeichnet, daß die Datei zur Überarbeitung auf ein empfangendes Endgerät des Absenders, das gleichfalls in das Netz eingebunden ist, zurückgeschickt wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Endgerät eine Tastatur zur Eingabe von Textzeichen und einen Bildschirm, auf dem der Text ausgegeben wird, aufweist.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß der Text im SMS Format erstellt und auf dem Bildschirm eines mobilen Telephones ausgegeben wird.
4. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, daß der gesprochene Text bei der Umwandlung durch das Programm in eine andere Sprache übersetzt wird.
5. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, daß die umgewandelten Teile der Sprache unmittelbar nach der Umwandlung auf dem Bildschirm dargestellt werden.
6. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, daß die überarbeiteten Teile des Textes an den Computer zurückgesendet und vermittels eines lernfähigen Algorithmus zur Adaption des Programmes an die Charakteristik der Stimme des Absenders verarbeitet werden.
7. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, daß der Text nach der Überarbeitung durch den Absender an einen anderen Adressaten verschickt wird.
8. Verfahren nach einem der vorherigen Ansprüche, dadurch gekennzeichnet, daß die vom Programm nicht eindeutig identifizierten Worte im Text markiert werden.
9. System zur Umsetzung des Verfahrens nach einem der vorherigen Ansprüche aufweisend ein Kommunikationsnetz, in das Netz eingebundene Endgeräte und einen Computer, auf dem ein Programm zur Sprachkonvertierung realisiert ist, gekennzeichnet durch ein Diktier-Modul, das dem Programm eine in einer Sprache zugeführte Signalfolge, enthaltend Textfragmente Worte oder einen Text, in eine Datei umfassend lesbare Zeichen umwandelt und an das Endgerät des Absenders zurücksendet.
10. System nach Anspruch 9, gekennzeichnet durch Endgeräte, insbesondere Telephone, mobile Telephone oder Computer, die ein Mikrophon zur Eingabe der Sprache und Bildschirme zur Ausgabe der Datei aufweisen.
DE2002113163 2002-03-23 2002-03-23 Verfahren zur Korrektur von Texten Withdrawn DE10213163A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE2002113163 DE10213163A1 (de) 2002-03-23 2002-03-23 Verfahren zur Korrektur von Texten

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE2002113163 DE10213163A1 (de) 2002-03-23 2002-03-23 Verfahren zur Korrektur von Texten

Publications (1)

Publication Number Publication Date
DE10213163A1 true DE10213163A1 (de) 2003-10-02

Family

ID=27798152

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2002113163 Withdrawn DE10213163A1 (de) 2002-03-23 2002-03-23 Verfahren zur Korrektur von Texten

Country Status (1)

Country Link
DE (1) DE10213163A1 (de)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19624987A1 (de) * 1996-06-22 1998-01-02 Peter Dr Toma Automatisches Sprachumsetzungsverfahren
DE10003529A1 (de) * 2000-01-27 2001-08-16 Siemens Ag Verfahren und Vorrichtung zum Erstellen einer Textdatei mittels Spracherkennung

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19624987A1 (de) * 1996-06-22 1998-01-02 Peter Dr Toma Automatisches Sprachumsetzungsverfahren
DE10003529A1 (de) * 2000-01-27 2001-08-16 Siemens Ag Verfahren und Vorrichtung zum Erstellen einer Textdatei mittels Spracherkennung

Similar Documents

Publication Publication Date Title
DE60109956T2 (de) Vorrichtung und verfahren zur telefonie-basierten spracherkennung für das bereitstellen von informationen zum sortieren von poststücken und paketen.
DE10117367B4 (de) Verfahren und System zur automatischen Umsetzung von Text-Nachrichten in Sprach-Nachrichten
DE19911693A1 (de) Telekommunikationsanlage und Verfahren zum Betrieb der Anlage
DE10118125A1 (de) Automatisches Auskunftssystem
DE10153747A1 (de) Mobiles Endgerät sowie Kommunikationssystem mit integriertem mobilen Endgerät
EP0471677B1 (de) Nachrichtenübertragungssystem
DE10213163A1 (de) Verfahren zur Korrektur von Texten
EP1554898B1 (de) Konverter für mobilfunknetze zur erzeugung von einheitsformaten
DE102012213914A1 (de) Verfahren und System zum Bereitstellen einer Übersetzung eines Sprachinhalts aus einem ersten Audiosignal
EP1643739A1 (de) Telekommunikationsnetz und Dienstrechner sowie Verfahren zum Austausch von Nachrichten zwischen einem Endteilnehmer und einem Textnachrichten-Server
WO2002049004A2 (de) Verfahren und anordnung zur spracherkennung für ein kleingerät
DE19739792A1 (de) Dezentrale Ausführung von Funktionen/Diensten eines Mobilfunksystems
WO2001035392A1 (de) Mobiltelefon sowie mobiltelefon-zusatzmodul
DE10003529A1 (de) Verfahren und Vorrichtung zum Erstellen einer Textdatei mittels Spracherkennung
EP1122716A2 (de) Vorrichtung zur Umwandlung von gedruckten Texten in Sprache
WO2001015009A2 (de) Internetzugriff mit sprachein- und ausgabe
DE10016019A1 (de) Verfahren zur automatischen Übersetzung während der Übertragung von Informationen und System zur Durchführung des Verfahrens
DE10122192B4 (de) Kommunikationseinrichtung
DE102025131074A1 (de) Kommunikationssystem mit Simultanübersetzung
DE10214930B4 (de) Verfahren zur Übertragung von Daten aus einem Datennetz an ein Telekommunikationsendgerät
DE202022101429U1 (de) Intelligentes System zur Erstellung von Sitzungsprotokollen mit Hilfe von künstlicher Intelligenz und maschinellem Lernen
Campbell How did US broadcasters report on Donald Trump before, during, and after his presidency? A comparative content analysis of CNN and Fox News
DE10065546A1 (de) Übersetzung von SMS-Nachrichten
DE102022208762A1 (de) Textextraktion aus Audiodaten in einem Fahrzeug
DE10239812A1 (de) Kommunikationsanordnung, insbesondere Gehörlosen-Kommunikationssystem

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8141 Disposal/no request for examination