DE04020133T1 - System zur Erkennung von Fehlern in der Sprachklassifizierung, und Verfahren und Programm dazu - Google Patents
System zur Erkennung von Fehlern in der Sprachklassifizierung, und Verfahren und Programm dazu Download PDFInfo
- Publication number
- DE04020133T1 DE04020133T1 DE04020133T DE04020133T DE04020133T1 DE 04020133 T1 DE04020133 T1 DE 04020133T1 DE 04020133 T DE04020133 T DE 04020133T DE 04020133 T DE04020133 T DE 04020133T DE 04020133 T1 DE04020133 T1 DE 04020133T1
- Authority
- DE
- Germany
- Prior art keywords
- waveform data
- data
- waveform
- speech unit
- error detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims 2
- 238000001514 detection method Methods 0.000 claims abstract 14
- 238000002372 labelling Methods 0.000 claims abstract 2
- 238000001228 spectrum Methods 0.000 claims 2
- 238000013480 data collection Methods 0.000 claims 1
- 238000011156 evaluation Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Telephonic Communication Services (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
Fehlererkennungssystem
bei Stimmkennzeichnung, das Folgendes beinhaltet:
Datenerfassungsmittel zur Erfassung der Wellenform-Daten, welche eine Wellenform einer Sprecheinheit darstellen, und der Kennzeichnungs-Daten zur Identifizierung der Art besagter Sprecheinheit;
Zuordnungsmittel zur Zuordnung der Wellenform-Daten, welche von dem Datenerfassungsmittel erfasst werden, zu den Arten der Sprecheinheiten, und zwar auf Grundlage der Kennzeichnungs-Daten, die von dem Datenerfassungsmittel erfasst werden;
Mittel zur Bestimmung des Beurteilungswerts, um eine Frequenz eines Formants jeder Sprecheinheit zu spezifizieren, welche durch die Wellenform-Daten dargestellt wird, welche von dem Datenerfassungsmittel erfasst werden, und um einen Beurteilungswert der Wellenform-Daten auf Grundlage der spezifizierten Frequenz festzulegen; und
Fehlererkennungsmittel zur Erkennung jener Wellenform-Daten unter einem Satz der selben Art zugeordneten Wellenform-Daten, für welche eine Abweichung des Beurteilungswerts innerhalb des Satzes einen vorher festgelegten Umfang erreicht, und zum Output jener Daten, welche die erkannten Wellenform-Daten darstellen, als Wellenform-Daten, die einen Kennzeichnungsfehler aufweisen.
Datenerfassungsmittel zur Erfassung der Wellenform-Daten, welche eine Wellenform einer Sprecheinheit darstellen, und der Kennzeichnungs-Daten zur Identifizierung der Art besagter Sprecheinheit;
Zuordnungsmittel zur Zuordnung der Wellenform-Daten, welche von dem Datenerfassungsmittel erfasst werden, zu den Arten der Sprecheinheiten, und zwar auf Grundlage der Kennzeichnungs-Daten, die von dem Datenerfassungsmittel erfasst werden;
Mittel zur Bestimmung des Beurteilungswerts, um eine Frequenz eines Formants jeder Sprecheinheit zu spezifizieren, welche durch die Wellenform-Daten dargestellt wird, welche von dem Datenerfassungsmittel erfasst werden, und um einen Beurteilungswert der Wellenform-Daten auf Grundlage der spezifizierten Frequenz festzulegen; und
Fehlererkennungsmittel zur Erkennung jener Wellenform-Daten unter einem Satz der selben Art zugeordneten Wellenform-Daten, für welche eine Abweichung des Beurteilungswerts innerhalb des Satzes einen vorher festgelegten Umfang erreicht, und zum Output jener Daten, welche die erkannten Wellenform-Daten darstellen, als Wellenform-Daten, die einen Kennzeichnungsfehler aufweisen.
Claims (9)
- Fehlererkennungssystem bei Stimmkennzeichnung, das Folgendes beinhaltet: Datenerfassungsmittel zur Erfassung der Wellenform-Daten, welche eine Wellenform einer Sprecheinheit darstellen, und der Kennzeichnungs-Daten zur Identifizierung der Art besagter Sprecheinheit; Zuordnungsmittel zur Zuordnung der Wellenform-Daten, welche von dem Datenerfassungsmittel erfasst werden, zu den Arten der Sprecheinheiten, und zwar auf Grundlage der Kennzeichnungs-Daten, die von dem Datenerfassungsmittel erfasst werden; Mittel zur Bestimmung des Beurteilungswerts, um eine Frequenz eines Formants jeder Sprecheinheit zu spezifizieren, welche durch die Wellenform-Daten dargestellt wird, welche von dem Datenerfassungsmittel erfasst werden, und um einen Beurteilungswert der Wellenform-Daten auf Grundlage der spezifizierten Frequenz festzulegen; und Fehlererkennungsmittel zur Erkennung jener Wellenform-Daten unter einem Satz der selben Art zugeordneten Wellenform-Daten, für welche eine Abweichung des Beurteilungswerts innerhalb des Satzes einen vorher festgelegten Umfang erreicht, und zum Output jener Daten, welche die erkannten Wellenform-Daten darstellen, als Wellenform-Daten, die einen Kennzeichnungsfehler aufweisen.
- Fehlererkennungssystem bei Stimmkennzeichnung nach Anspruch 1, dadurch gekennzeichnet, dass der Beurteilungswert eine lineare Kombination der Werte {|f(k) – F(k)|} ist, wobei der k-Wert für eine Ganzzahl von 1 bis n steht, wobei davon ausgegangen wird, dass F(k) die Frequenz des k-ten Formants einer Sprecheinheit ist, die durch die Wellenform-Daten zur Berechnung des Beurteilungswerts angegeben wird, und f(k) der Durchschnittswert der Frequenz des k-ten Formants der Sprecheinheit ist, der von allen Wellenform-Daten angegeben wird, welche der selben Art wie besagte Wellenform-Daten zugeordnet werden.
- Fehlererkennungssystem bei Stimmkennzeichnung nach Anspruch 1, dadurch gekennzeichnet, dass der Beurteilungswert eine lineare Kombination mehrerer Formantfrequenzen in dem Spektrum erfasster Wellenform-Daten ist.
- Fehlererkennungssystem bei Stimmkennzeichnung nach Anspruch 1, 2 oder 3, dadurch gekennzeichnet, dass das Mittel zur Bestimmung des Beurteilungswerts mit der Frequenz am Maximalwert des Spektrums in den Wellenform-Daten als der Sprecheinheit-Formantfrequenz umgeht, welche durch die Wellenform-Daten angegeben wird.
- Fehlererkennungssystem bei Stimmkennzeichnung nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass das Mittel zur Bestimmung des Beurteilungswerts die Art des Formants spezifiziert, welcher zur Bestimmung des Beurteilungswerts jener Wellenform-Daten als der Art von Sprecheinheit verwendet wird, die von den Wellenform-Daten angegeben wird, und zwar entsprechend der Art der Kennzeichnungs-Daten.
- Fehlererkennungssystem bei Stimmkennzeichnung nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass das Fehlererkennungsmittel die Wellenform-Daten, die mit jenen Kennzeichnungs-Daten assoziiert sind, welche ein stimmloses Stadium anzeigen, bei dem die Stärke der Stimme, welche durch die Wellenform-Daten dargestellt wird, einen zuvor festgelegten Umfang erreicht, als jene Wellenform-Daten erkennt, in welchen die Kennzeichnung einen Fehler hat.
- Fehlererkennungssystem bei Stimmkennzeichnung nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass das Zuordnungsmittel Mittel beinhaltet, um alle Wellenform-Daten zu verknüpfen, die der selben Art in der Form zugeordnet wurden, dass zwei benachbarte Wellenform-Datenteile Daten in ihrer Mitte haben, welche das stimmlose Stadium dazwischen anzeigen.
- Verfahren zur Fehlererkennung bei Stimmkennzeichnung, das folgende Schritte beinhaltet: Erfassung der Wellenform-Daten, welche eine Wellenform einer Sprecheinheit darstellen, und der Kennzeichnungs-Daten zur Identifizierung der Art besagter Sprecheinheit; Zuordnung der erfassten Wellenform-Daten zu den Sprecheinheitsarten, und zwar auf Grundlage der erfassten Kennzeichnungs-Daten; Spezifizierung einer Frequenz eines Formants jeder Sprecheinheit, die durch die Wellenform-Daten dargestellt wird, und Bestimmung eines Beurteilungswerts der Wellenform-Daten auf Grundlage der spezifizierten Frequenz; und Erkennung jener Wellenform-Daten mit einem Kennzeichnungsfehler unter einem Satz der selben Art zugeordneten Wellenform-Daten, in welchen eine Abweichung vom Beurteilungswert innerhalb des Satzes einen vorher festgelegten Umfang erreicht, und Output von Daten, welche die erkannten Wellenform-Daten darstellen.
- Programm, welches einen Computer in die Lage versetzt, zu funktionieren als: Datenerfassungsmittel zur Erfassung der Wellenform-Daten, welche eine Wellenform einer Sprecheinheit darstellen, und der Kennzeichnungs-Daten zur Identifizierung der Art besagter Sprecheinheit; Zuordnungsmittel zur Zuordnung der Wellenform-Daten, die durch das Datenerfassungsmittel erfasst werden, zu Sprecheinheitsarten, und zwar auf Grundlage der Kennzeichnungs-Daten, welche von dem Datenerfassungsmittel erfasst werden; Mittel zur Bestimmung des Beurteilungswerts, um eine Frequenz eines Formants jeder Sprecheinheit festzustellen, welche von den Wellenform-Daten dargestellt wird, welche wiederum von den Datenerfassungsmitteln erfasst werden, und um einen Beurteilungswert der Wellenform-Daten auf Grundlage der spezifizierten Frequenz zu bestimmen; und Fehlererkennungsmittel zur Erkennung jener Wellenform-Daten mit einem Kennzeichnungsfehler unter einem Satz der selben Art zugeordneten Wellenform-Daten, in welchen eine Abweichung vom Beurteilungswert innerhalb des Satzes einen vorher festgelegten Umfang erreicht, und zum Output der Daten, welche die erkannten Wellenform-Daten darstellen.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003302646 | 2003-08-27 | ||
| JP2003302646A JP4150645B2 (ja) | 2003-08-27 | 2003-08-27 | 音声ラベリングエラー検出装置、音声ラベリングエラー検出方法及びプログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE04020133T1 true DE04020133T1 (de) | 2005-07-14 |
Family
ID=34101192
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE602004000898T Expired - Lifetime DE602004000898T2 (de) | 2003-08-27 | 2004-08-25 | System zur Erkennung von Fehlern in der Sprachklassifizierung, und Verfahren und Programm dazu |
| DE04020133T Pending DE04020133T1 (de) | 2003-08-27 | 2004-08-25 | System zur Erkennung von Fehlern in der Sprachklassifizierung, und Verfahren und Programm dazu |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE602004000898T Expired - Lifetime DE602004000898T2 (de) | 2003-08-27 | 2004-08-25 | System zur Erkennung von Fehlern in der Sprachklassifizierung, und Verfahren und Programm dazu |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US7454347B2 (de) |
| EP (1) | EP1511009B1 (de) |
| JP (1) | JP4150645B2 (de) |
| DE (2) | DE602004000898T2 (de) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4158937B2 (ja) * | 2006-03-24 | 2008-10-01 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 字幕修正装置 |
| JP4981519B2 (ja) * | 2007-05-25 | 2012-07-25 | 日本電信電話株式会社 | 学習データのラベル誤り候補抽出装置、その方法及びプログラム、その記録媒体 |
| CN102237081B (zh) * | 2010-04-30 | 2013-04-24 | 国际商业机器公司 | 语音韵律评估方法与系统 |
| US9824684B2 (en) * | 2014-11-13 | 2017-11-21 | Microsoft Technology Licensing, Llc | Prediction-based sequence recognition |
| JP6585022B2 (ja) * | 2016-11-11 | 2019-10-02 | 株式会社東芝 | 音声認識装置、音声認識方法およびプログラム |
| US20220406289A1 (en) * | 2019-11-25 | 2022-12-22 | Nippon Telegraph And Telephone Corporation | Detection apparatus, method and program for the same |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5390278A (en) * | 1991-10-08 | 1995-02-14 | Bell Canada | Phoneme based speech recognition |
| US5796916A (en) * | 1993-01-21 | 1998-08-18 | Apple Computer, Inc. | Method and apparatus for prosody for synthetic speech prosody determination |
| JPH06266389A (ja) | 1993-03-10 | 1994-09-22 | N T T Data Tsushin Kk | 音素ラベリング装置 |
| JPH1138989A (ja) * | 1997-07-14 | 1999-02-12 | Toshiba Corp | 音声合成装置及び方法 |
| US6411932B1 (en) * | 1998-06-12 | 2002-06-25 | Texas Instruments Incorporated | Rule-based learning of word pronunciations from training corpora |
| EP1138038B1 (de) * | 1998-11-13 | 2005-06-22 | Lernout & Hauspie Speech Products N.V. | Sprachsynthese durch verkettung von sprachwellenformen |
| JP3841596B2 (ja) * | 1999-09-08 | 2006-11-01 | パイオニア株式会社 | 音素データの生成方法及び音声合成装置 |
| JP2003271182A (ja) * | 2002-03-18 | 2003-09-25 | Toshiba Corp | 音響モデル作成装置及び音響モデル作成方法 |
| US7266497B2 (en) * | 2002-03-29 | 2007-09-04 | At&T Corp. | Automatic segmentation in speech synthesis |
| US7280967B2 (en) * | 2003-07-30 | 2007-10-09 | International Business Machines Corporation | Method for detecting misaligned phonetic units for a concatenative text-to-speech voice |
-
2003
- 2003-08-27 JP JP2003302646A patent/JP4150645B2/ja not_active Expired - Lifetime
-
2004
- 2004-08-18 US US10/920,454 patent/US7454347B2/en active Active
- 2004-08-25 DE DE602004000898T patent/DE602004000898T2/de not_active Expired - Lifetime
- 2004-08-25 DE DE04020133T patent/DE04020133T1/de active Pending
- 2004-08-25 EP EP04020133A patent/EP1511009B1/de not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| US20050060144A1 (en) | 2005-03-17 |
| EP1511009B1 (de) | 2006-05-17 |
| US7454347B2 (en) | 2008-11-18 |
| DE602004000898D1 (de) | 2006-06-22 |
| EP1511009A1 (de) | 2005-03-02 |
| JP4150645B2 (ja) | 2008-09-17 |
| JP2005070604A (ja) | 2005-03-17 |
| DE602004000898T2 (de) | 2006-09-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6438549B1 (ja) | 機械学習を用いた未知化合物の分類方法 | |
| CN102809493B (zh) | 异常音诊断装置 | |
| CN105424395B (zh) | 设备故障的确定方法和装置 | |
| CN113283768B (zh) | 食品检测项目提取方法、装置、设备及存储介质 | |
| CN109297534B (zh) | 用于评价室内环境质量的环境参数权重确定方法及系统 | |
| DE04020133T1 (de) | System zur Erkennung von Fehlern in der Sprachklassifizierung, und Verfahren und Programm dazu | |
| EP1420344A3 (de) | Verfahren und Vorrichtung zur Vorhersage der Sicherheit von Softwareprogrammen | |
| CN115659143A (zh) | 一种基于试验设计的故障实时诊断方法 | |
| US20210089886A1 (en) | Method for processing data based on neural networks trained by different methods and device applying method | |
| KR20220081641A (ko) | 빅데이터를 활용한 그림검사 평가보고서 자동생성시스템 | |
| EP4431871A3 (de) | Verfahren und vorrichtung zum erzeugen eines prüfplans für die prüfung eines messobjekts, verfahren und vorrichtung zum prüfen eines messobjekts und sowie computerprogrammprodukt | |
| DE112019007899T5 (de) | System und Methode für die Vorhersage von Gerätefehler mittels akustischer Signale im Ultraschallfrequenzband | |
| DE4302657C1 (de) | Verfahren zur Bestimmung von Kontaminaten in Behältern | |
| DE04711759T1 (de) | Sprachsyntheseverarbeitungssystem | |
| Haq et al. | Trade liberalization, manufacturing value addition, and economic growth: Empirical evidence in case of Pakistan | |
| CN111553816B (zh) | 行政复议影响因素分析方法及装置 | |
| CN117237310A (zh) | 一种基于图像识别的钢结构件缺陷检测方法及系统 | |
| WO2018206219A1 (de) | Automatisierte klangprobe an mehrkomponentigen bauteilen mittels mustererkennung | |
| CN104376212B (zh) | 评估作业正确率的方法及装置 | |
| CN118299008B (zh) | 医学影像报告分级的方法、装置及设备 | |
| EP1993062A3 (de) | Verfahren und biometrisches System zum Erkennen von Latenzabdrücken | |
| JPH0895959A (ja) | 時系列データ圧縮、解析、表示方法および解析監視装置 | |
| EP2491367B1 (de) | Verfahren zur bestimmung der weichheit von tissuepapier | |
| CN115685010A (zh) | 一种配网变压器状态分析装置 | |
| CN111859594B (zh) | 地铁信号设备使用寿命评估方法及系统 |