[go: up one dir, main page]

DE04020133T1 - System zur Erkennung von Fehlern in der Sprachklassifizierung, und Verfahren und Programm dazu - Google Patents

System zur Erkennung von Fehlern in der Sprachklassifizierung, und Verfahren und Programm dazu Download PDF

Info

Publication number
DE04020133T1
DE04020133T1 DE04020133T DE04020133T DE04020133T1 DE 04020133 T1 DE04020133 T1 DE 04020133T1 DE 04020133 T DE04020133 T DE 04020133T DE 04020133 T DE04020133 T DE 04020133T DE 04020133 T1 DE04020133 T1 DE 04020133T1
Authority
DE
Germany
Prior art keywords
waveform data
data
waveform
speech unit
error detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE04020133T
Other languages
English (en)
Inventor
Rika Kobe-shi Koyama
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kenwood KK
Original Assignee
Kenwood KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kenwood KK filed Critical Kenwood KK
Publication of DE04020133T1 publication Critical patent/DE04020133T1/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Telephonic Communication Services (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

Fehlererkennungssystem bei Stimmkennzeichnung, das Folgendes beinhaltet:
Datenerfassungsmittel zur Erfassung der Wellenform-Daten, welche eine Wellenform einer Sprecheinheit darstellen, und der Kennzeichnungs-Daten zur Identifizierung der Art besagter Sprecheinheit;
Zuordnungsmittel zur Zuordnung der Wellenform-Daten, welche von dem Datenerfassungsmittel erfasst werden, zu den Arten der Sprecheinheiten, und zwar auf Grundlage der Kennzeichnungs-Daten, die von dem Datenerfassungsmittel erfasst werden;
Mittel zur Bestimmung des Beurteilungswerts, um eine Frequenz eines Formants jeder Sprecheinheit zu spezifizieren, welche durch die Wellenform-Daten dargestellt wird, welche von dem Datenerfassungsmittel erfasst werden, und um einen Beurteilungswert der Wellenform-Daten auf Grundlage der spezifizierten Frequenz festzulegen; und
Fehlererkennungsmittel zur Erkennung jener Wellenform-Daten unter einem Satz der selben Art zugeordneten Wellenform-Daten, für welche eine Abweichung des Beurteilungswerts innerhalb des Satzes einen vorher festgelegten Umfang erreicht, und zum Output jener Daten, welche die erkannten Wellenform-Daten darstellen, als Wellenform-Daten, die einen Kennzeichnungsfehler aufweisen.

Claims (9)

  1. Fehlererkennungssystem bei Stimmkennzeichnung, das Folgendes beinhaltet: Datenerfassungsmittel zur Erfassung der Wellenform-Daten, welche eine Wellenform einer Sprecheinheit darstellen, und der Kennzeichnungs-Daten zur Identifizierung der Art besagter Sprecheinheit; Zuordnungsmittel zur Zuordnung der Wellenform-Daten, welche von dem Datenerfassungsmittel erfasst werden, zu den Arten der Sprecheinheiten, und zwar auf Grundlage der Kennzeichnungs-Daten, die von dem Datenerfassungsmittel erfasst werden; Mittel zur Bestimmung des Beurteilungswerts, um eine Frequenz eines Formants jeder Sprecheinheit zu spezifizieren, welche durch die Wellenform-Daten dargestellt wird, welche von dem Datenerfassungsmittel erfasst werden, und um einen Beurteilungswert der Wellenform-Daten auf Grundlage der spezifizierten Frequenz festzulegen; und Fehlererkennungsmittel zur Erkennung jener Wellenform-Daten unter einem Satz der selben Art zugeordneten Wellenform-Daten, für welche eine Abweichung des Beurteilungswerts innerhalb des Satzes einen vorher festgelegten Umfang erreicht, und zum Output jener Daten, welche die erkannten Wellenform-Daten darstellen, als Wellenform-Daten, die einen Kennzeichnungsfehler aufweisen.
  2. Fehlererkennungssystem bei Stimmkennzeichnung nach Anspruch 1, dadurch gekennzeichnet, dass der Beurteilungswert eine lineare Kombination der Werte {|f(k) – F(k)|} ist, wobei der k-Wert für eine Ganzzahl von 1 bis n steht, wobei davon ausgegangen wird, dass F(k) die Frequenz des k-ten Formants einer Sprecheinheit ist, die durch die Wellenform-Daten zur Berechnung des Beurteilungswerts angegeben wird, und f(k) der Durchschnittswert der Frequenz des k-ten Formants der Sprecheinheit ist, der von allen Wellenform-Daten angegeben wird, welche der selben Art wie besagte Wellenform-Daten zugeordnet werden.
  3. Fehlererkennungssystem bei Stimmkennzeichnung nach Anspruch 1, dadurch gekennzeichnet, dass der Beurteilungswert eine lineare Kombination mehrerer Formantfrequenzen in dem Spektrum erfasster Wellenform-Daten ist.
  4. Fehlererkennungssystem bei Stimmkennzeichnung nach Anspruch 1, 2 oder 3, dadurch gekennzeichnet, dass das Mittel zur Bestimmung des Beurteilungswerts mit der Frequenz am Maximalwert des Spektrums in den Wellenform-Daten als der Sprecheinheit-Formantfrequenz umgeht, welche durch die Wellenform-Daten angegeben wird.
  5. Fehlererkennungssystem bei Stimmkennzeichnung nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass das Mittel zur Bestimmung des Beurteilungswerts die Art des Formants spezifiziert, welcher zur Bestimmung des Beurteilungswerts jener Wellenform-Daten als der Art von Sprecheinheit verwendet wird, die von den Wellenform-Daten angegeben wird, und zwar entsprechend der Art der Kennzeichnungs-Daten.
  6. Fehlererkennungssystem bei Stimmkennzeichnung nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass das Fehlererkennungsmittel die Wellenform-Daten, die mit jenen Kennzeichnungs-Daten assoziiert sind, welche ein stimmloses Stadium anzeigen, bei dem die Stärke der Stimme, welche durch die Wellenform-Daten dargestellt wird, einen zuvor festgelegten Umfang erreicht, als jene Wellenform-Daten erkennt, in welchen die Kennzeichnung einen Fehler hat.
  7. Fehlererkennungssystem bei Stimmkennzeichnung nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass das Zuordnungsmittel Mittel beinhaltet, um alle Wellenform-Daten zu verknüpfen, die der selben Art in der Form zugeordnet wurden, dass zwei benachbarte Wellenform-Datenteile Daten in ihrer Mitte haben, welche das stimmlose Stadium dazwischen anzeigen.
  8. Verfahren zur Fehlererkennung bei Stimmkennzeichnung, das folgende Schritte beinhaltet: Erfassung der Wellenform-Daten, welche eine Wellenform einer Sprecheinheit darstellen, und der Kennzeichnungs-Daten zur Identifizierung der Art besagter Sprecheinheit; Zuordnung der erfassten Wellenform-Daten zu den Sprecheinheitsarten, und zwar auf Grundlage der erfassten Kennzeichnungs-Daten; Spezifizierung einer Frequenz eines Formants jeder Sprecheinheit, die durch die Wellenform-Daten dargestellt wird, und Bestimmung eines Beurteilungswerts der Wellenform-Daten auf Grundlage der spezifizierten Frequenz; und Erkennung jener Wellenform-Daten mit einem Kennzeichnungsfehler unter einem Satz der selben Art zugeordneten Wellenform-Daten, in welchen eine Abweichung vom Beurteilungswert innerhalb des Satzes einen vorher festgelegten Umfang erreicht, und Output von Daten, welche die erkannten Wellenform-Daten darstellen.
  9. Programm, welches einen Computer in die Lage versetzt, zu funktionieren als: Datenerfassungsmittel zur Erfassung der Wellenform-Daten, welche eine Wellenform einer Sprecheinheit darstellen, und der Kennzeichnungs-Daten zur Identifizierung der Art besagter Sprecheinheit; Zuordnungsmittel zur Zuordnung der Wellenform-Daten, die durch das Datenerfassungsmittel erfasst werden, zu Sprecheinheitsarten, und zwar auf Grundlage der Kennzeichnungs-Daten, welche von dem Datenerfassungsmittel erfasst werden; Mittel zur Bestimmung des Beurteilungswerts, um eine Frequenz eines Formants jeder Sprecheinheit festzustellen, welche von den Wellenform-Daten dargestellt wird, welche wiederum von den Datenerfassungsmitteln erfasst werden, und um einen Beurteilungswert der Wellenform-Daten auf Grundlage der spezifizierten Frequenz zu bestimmen; und Fehlererkennungsmittel zur Erkennung jener Wellenform-Daten mit einem Kennzeichnungsfehler unter einem Satz der selben Art zugeordneten Wellenform-Daten, in welchen eine Abweichung vom Beurteilungswert innerhalb des Satzes einen vorher festgelegten Umfang erreicht, und zum Output der Daten, welche die erkannten Wellenform-Daten darstellen.
DE04020133T 2003-08-27 2004-08-25 System zur Erkennung von Fehlern in der Sprachklassifizierung, und Verfahren und Programm dazu Pending DE04020133T1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003302646 2003-08-27
JP2003302646A JP4150645B2 (ja) 2003-08-27 2003-08-27 音声ラベリングエラー検出装置、音声ラベリングエラー検出方法及びプログラム

Publications (1)

Publication Number Publication Date
DE04020133T1 true DE04020133T1 (de) 2005-07-14

Family

ID=34101192

Family Applications (2)

Application Number Title Priority Date Filing Date
DE602004000898T Expired - Lifetime DE602004000898T2 (de) 2003-08-27 2004-08-25 System zur Erkennung von Fehlern in der Sprachklassifizierung, und Verfahren und Programm dazu
DE04020133T Pending DE04020133T1 (de) 2003-08-27 2004-08-25 System zur Erkennung von Fehlern in der Sprachklassifizierung, und Verfahren und Programm dazu

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE602004000898T Expired - Lifetime DE602004000898T2 (de) 2003-08-27 2004-08-25 System zur Erkennung von Fehlern in der Sprachklassifizierung, und Verfahren und Programm dazu

Country Status (4)

Country Link
US (1) US7454347B2 (de)
EP (1) EP1511009B1 (de)
JP (1) JP4150645B2 (de)
DE (2) DE602004000898T2 (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4158937B2 (ja) * 2006-03-24 2008-10-01 インターナショナル・ビジネス・マシーンズ・コーポレーション 字幕修正装置
JP4981519B2 (ja) * 2007-05-25 2012-07-25 日本電信電話株式会社 学習データのラベル誤り候補抽出装置、その方法及びプログラム、その記録媒体
CN102237081B (zh) * 2010-04-30 2013-04-24 国际商业机器公司 语音韵律评估方法与系统
US9824684B2 (en) * 2014-11-13 2017-11-21 Microsoft Technology Licensing, Llc Prediction-based sequence recognition
JP6585022B2 (ja) * 2016-11-11 2019-10-02 株式会社東芝 音声認識装置、音声認識方法およびプログラム
US20220406289A1 (en) * 2019-11-25 2022-12-22 Nippon Telegraph And Telephone Corporation Detection apparatus, method and program for the same

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5390278A (en) * 1991-10-08 1995-02-14 Bell Canada Phoneme based speech recognition
US5796916A (en) * 1993-01-21 1998-08-18 Apple Computer, Inc. Method and apparatus for prosody for synthetic speech prosody determination
JPH06266389A (ja) 1993-03-10 1994-09-22 N T T Data Tsushin Kk 音素ラベリング装置
JPH1138989A (ja) * 1997-07-14 1999-02-12 Toshiba Corp 音声合成装置及び方法
US6411932B1 (en) * 1998-06-12 2002-06-25 Texas Instruments Incorporated Rule-based learning of word pronunciations from training corpora
EP1138038B1 (de) * 1998-11-13 2005-06-22 Lernout & Hauspie Speech Products N.V. Sprachsynthese durch verkettung von sprachwellenformen
JP3841596B2 (ja) * 1999-09-08 2006-11-01 パイオニア株式会社 音素データの生成方法及び音声合成装置
JP2003271182A (ja) * 2002-03-18 2003-09-25 Toshiba Corp 音響モデル作成装置及び音響モデル作成方法
US7266497B2 (en) * 2002-03-29 2007-09-04 At&T Corp. Automatic segmentation in speech synthesis
US7280967B2 (en) * 2003-07-30 2007-10-09 International Business Machines Corporation Method for detecting misaligned phonetic units for a concatenative text-to-speech voice

Also Published As

Publication number Publication date
US20050060144A1 (en) 2005-03-17
EP1511009B1 (de) 2006-05-17
US7454347B2 (en) 2008-11-18
DE602004000898D1 (de) 2006-06-22
EP1511009A1 (de) 2005-03-02
JP4150645B2 (ja) 2008-09-17
JP2005070604A (ja) 2005-03-17
DE602004000898T2 (de) 2006-09-14

Similar Documents

Publication Publication Date Title
JP6438549B1 (ja) 機械学習を用いた未知化合物の分類方法
CN102809493B (zh) 异常音诊断装置
CN105424395B (zh) 设备故障的确定方法和装置
CN113283768B (zh) 食品检测项目提取方法、装置、设备及存储介质
CN109297534B (zh) 用于评价室内环境质量的环境参数权重确定方法及系统
DE04020133T1 (de) System zur Erkennung von Fehlern in der Sprachklassifizierung, und Verfahren und Programm dazu
EP1420344A3 (de) Verfahren und Vorrichtung zur Vorhersage der Sicherheit von Softwareprogrammen
CN115659143A (zh) 一种基于试验设计的故障实时诊断方法
US20210089886A1 (en) Method for processing data based on neural networks trained by different methods and device applying method
KR20220081641A (ko) 빅데이터를 활용한 그림검사 평가보고서 자동생성시스템
EP4431871A3 (de) Verfahren und vorrichtung zum erzeugen eines prüfplans für die prüfung eines messobjekts, verfahren und vorrichtung zum prüfen eines messobjekts und sowie computerprogrammprodukt
DE112019007899T5 (de) System und Methode für die Vorhersage von Gerätefehler mittels akustischer Signale im Ultraschallfrequenzband
DE4302657C1 (de) Verfahren zur Bestimmung von Kontaminaten in Behältern
DE04711759T1 (de) Sprachsyntheseverarbeitungssystem
Haq et al. Trade liberalization, manufacturing value addition, and economic growth: Empirical evidence in case of Pakistan
CN111553816B (zh) 行政复议影响因素分析方法及装置
CN117237310A (zh) 一种基于图像识别的钢结构件缺陷检测方法及系统
WO2018206219A1 (de) Automatisierte klangprobe an mehrkomponentigen bauteilen mittels mustererkennung
CN104376212B (zh) 评估作业正确率的方法及装置
CN118299008B (zh) 医学影像报告分级的方法、装置及设备
EP1993062A3 (de) Verfahren und biometrisches System zum Erkennen von Latenzabdrücken
JPH0895959A (ja) 時系列データ圧縮、解析、表示方法および解析監視装置
EP2491367B1 (de) Verfahren zur bestimmung der weichheit von tissuepapier
CN115685010A (zh) 一种配网变压器状态分析装置
CN111859594B (zh) 地铁信号设备使用寿命评估方法及系统