KR20100003574A - 음성음원정보 생성 장치 및 시스템, 그리고 이를 이용한음성음원정보 생성 방법 - Google Patents
음성음원정보 생성 장치 및 시스템, 그리고 이를 이용한음성음원정보 생성 방법 Download PDFInfo
- Publication number
- KR20100003574A KR20100003574A KR1020080063539A KR20080063539A KR20100003574A KR 20100003574 A KR20100003574 A KR 20100003574A KR 1020080063539 A KR1020080063539 A KR 1020080063539A KR 20080063539 A KR20080063539 A KR 20080063539A KR 20100003574 A KR20100003574 A KR 20100003574A
- Authority
- KR
- South Korea
- Prior art keywords
- sound source
- source information
- voice
- unit
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0018—Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (14)
- 텍스트 기반의 음원정보를 음성음원정보로 변환하기 위해 필요한 데이터를 서버로부터 수신받는 인터페이스부와;음원정보가 저장되는 메모리부와;상기 메모리부에 저장된 음원정보를 복수의 음단위로 분류하고 그에 대응되는 단위음성을 상기 인터페이스부를 통하여 수신하는 언어처리부와;상기 언어처리부에 의하여 수신된 단위음성 각각에 대하여 운율을 적용하는 운율제어부; 그리고상기 운율제어부에 의해 운율이 적용된 각각의 단위음성을 합성하여 음성음원정보를 생성하는 음성생성부를 포함하여 구성됨을 특징으로 하는 음성음원정보 생성 장치.
- 제1항에 있어서,상기 언어처리부는,상기 메모리부에 저장된 음원정보를 복수의 음단위로 분류하기에 앞서, 상기 음원정보에 대응되는 음성음원정보를 상기 인터페이스부를 통하여 상기 서버에 요청함을 특징으로 하는 음성음원정보 생성 장치.
- 제1항에 있어서,상기 음성생성부는,상기 음성음원정보를 해당 음원에 합성하여 하나의 음악파일을 생성함을 특징으로 하는 음성음원정보 생성 장치.
- 제1항 내지 제3항 중 어느 한 항에 있어서,상기 언어처리부는,상기 음원정보를 상기 음원정보에 포함된 텍스트에 대한 형태소 구분, 구문분석 및 의미해석을 기반으로 복수의 음단위로 분류하는 것을 특징으로 하는 음성음원정보 생성 장치.
- 제1항 내지 제3항 중 어느 한 항에 있어서,상기 운율제어부는,후지사키 모델을 이용하여 기본 주파수 피치 패턴을 생성하는 것을 특징으로 하는 음성음원정보 생성 장치.
- 텍스트 기반의 음원정보에 대응되는 음성음원정보가 저장되는 제1데이터베이스와;형태소 구분, 구문분석 및 의미해석을 기반으로 분류한 단위음성이 저장되는 제2데이터베이스가 저장된 서버와:상기 서버와 통신연결 가능한 인터페이스부와;음원정보를 복수의 음단위로 분류하고 그에 대응되는 단위음성을 상기 제2데이터베이스로부터 수신하는 언어처리부와;상기 언어처리부에 의하여 수신된 단위음성 각각에 대하여 운율을 적용하는 운율제어부; 그리고상기 운율제어부에 의해 운율이 적용된 각각의 단위음성을 합성하여 음성음원정보를 생성하는 음성생성부를 포함하는 음성음원정보 생성 장치를 포함하여 구성됨을 특징으로 하는 음성음원정보 생성 시스템.
- 제6항에 있어서,상기 언어처리부는,상기 음원정보를 복수의 음단위로 분류하기에 앞서, 상기 제1데이터베이스에 저장된 상기 음원정보에 대응되는 음성음원정보를 상기 서버에 요청함을 특징으로 하는 음성음원정보 생성 시스템.
- 제6항에 있어서,상기 음성생성부는,상기 음성음원정보를 해당 음원에 합성하여 하나의 음악파일을 생성함을 특징으로 하는 음성음원정보 생성 장치.
- (A)텍스트 형식의 음원정보를 음성음원정보로 변환하는 명령이 입력되는 단계와;(B)해당 음원정보에 포함된 텍스트를 서버로 전송하는 단계와;(C)상기 서버에서 상기 음원정보에 대응되는 음성음원정보를 검색하는 단계;그리고(D)상기 (C)단계에서 상기 음원정보에 대응되는 음성음원정보가 검색되지 않은 경우, 복수의 단위음성을 합성하여 상기 음원정보를 음성음원정보로 변환하는 단계를 포함하여 수행됨을 특징으로 하는 음성음원정보 생성 방법.
- 제9항에 있어서,상기 음성음원정보 생성 방법은,(E)상기 (D)단계에서 변환된 상기 음성음원정보를 그에 대응되는 음원에 합 성하는 단계를 더 포함하여 수행됨을 특징으로 하는 음성음원정보 생성 방법.
- 제9항에 있어서,상기 음성음원정보 생성 방법은,(F)상기 (C)단계에서 상기 음원정보에 대응되는 음성음원정보가 검색된 경우, 검색된 음성음원정보를 서버로부터 다운로드하여, 그에 대응되는 음원에 합성하는 단계를 포함하여 수행됨을 특징으로 하는 음성음원정보 생성 방법.
- 제9항 내지 제11항 중 어느 한 항에 있어서,상기 (D)단계는,(D1) 상기 음원정보에 포함된 텍스트를 발음기호열로 변환하고, 이를 복수의 음단위로 분류하는 단계와;(D2) 상기 (D1)단계에서 분류된 복수의 음단위에 대한 오디오 데이터인 단위음성을 상기 서버에 요청하는 단계와;(D3) 상기 서버로부터 요청된 단위음성을 수신하는 단계와;(D4) 수신된 단위음성 각각에 대하여 운율을 적용하는 단계; 그리고(D5) 운율 적용된 단위음성을 합성하여 음성음원정보를 생성하는 단계를 포함하여 수행됨을 특징으로 하는 음성음원정보 생성 방법.
- 제12항에 있어서,상기 (D1) 단계는,상기 음원정보에 포함된 텍스트를 형태소 구분, 구문분석 및 의미해석하여 음운변동을 적용하고 복수의 음단위로 분류함을 특징으로 하는 음성음원정보 생성 방법.
- 제12항에 있어서,상기 (D4) 단계는,후지사키 모델을 이용하여 기본 주파수 피치 패턴을 생성하는 단계를 포함하여 수행됨을 특징으로 하는 음성음원정보 생성 방법.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020080063539A KR20100003574A (ko) | 2008-07-01 | 2008-07-01 | 음성음원정보 생성 장치 및 시스템, 그리고 이를 이용한음성음원정보 생성 방법 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020080063539A KR20100003574A (ko) | 2008-07-01 | 2008-07-01 | 음성음원정보 생성 장치 및 시스템, 그리고 이를 이용한음성음원정보 생성 방법 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR20100003574A true KR20100003574A (ko) | 2010-01-11 |
Family
ID=41813343
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020080063539A Ceased KR20100003574A (ko) | 2008-07-01 | 2008-07-01 | 음성음원정보 생성 장치 및 시스템, 그리고 이를 이용한음성음원정보 생성 방법 |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR20100003574A (ko) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2012169844A3 (ko) * | 2011-06-08 | 2013-03-07 | 주식회사 내일이비즈 | 전자책 데이터 음성 합성 장치 및 그 방법 |
| KR20180103273A (ko) * | 2017-03-09 | 2018-09-19 | 에스케이텔레콤 주식회사 | 음성 합성 장치 및 음성 합성 방법 |
-
2008
- 2008-07-01 KR KR1020080063539A patent/KR20100003574A/ko not_active Ceased
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2012169844A3 (ko) * | 2011-06-08 | 2013-03-07 | 주식회사 내일이비즈 | 전자책 데이터 음성 합성 장치 및 그 방법 |
| KR20180103273A (ko) * | 2017-03-09 | 2018-09-19 | 에스케이텔레콤 주식회사 | 음성 합성 장치 및 음성 합성 방법 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9761219B2 (en) | System and method for distributed text-to-speech synthesis and intelligibility | |
| US7596499B2 (en) | Multilingual text-to-speech system with limited resources | |
| JP4130190B2 (ja) | 音声合成システム | |
| KR101274961B1 (ko) | 클라이언트단말기를 이용한 음악 컨텐츠 제작시스템 | |
| JP2003295882A (ja) | 音声合成用テキスト構造、音声合成方法、音声合成装置及びそのコンピュータ・プログラム | |
| KR20250033180A (ko) | 자연어로 표현된 스타일 태그를 이용한 합성 음성 생성 방법 및 시스템 | |
| CN1813285B (zh) | 语音合成设备和方法 | |
| JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
| US8626510B2 (en) | Speech synthesizing device, computer program product, and method | |
| JP2002221980A (ja) | テキスト音声変換装置 | |
| JP2008545995A (ja) | ハイブリッド音声合成装置、方法および用途 | |
| CN112382274B (zh) | 音频合成方法、装置、设备以及存储介质 | |
| CN112669815B (zh) | 歌曲定制生成方法及其相应的装置、设备、介质 | |
| JP4516863B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
| US20090281808A1 (en) | Voice data creation system, program, semiconductor integrated circuit device, and method for producing semiconductor integrated circuit device | |
| CN111477210A (zh) | 语音合成方法和装置 | |
| CN112382269B (zh) | 音频合成方法、装置、设备以及存储介质 | |
| Bulyko et al. | Efficient integrated response generation from multiple targets using weighted finite state transducers | |
| JP4287785B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
| KR102277205B1 (ko) | 오디오 변환 장치 및 방법 | |
| JP2006293026A (ja) | 音声合成装置,音声合成方法およびコンピュータプログラム | |
| KR20100003574A (ko) | 음성음원정보 생성 장치 및 시스템, 그리고 이를 이용한음성음원정보 생성 방법 | |
| CN117238273A (zh) | 歌声合成方法、计算机设备和存储介质 | |
| JP2005018036A (ja) | 音声合成装置、音声合成方法及びプログラム | |
| JP4209811B2 (ja) | 音声選択装置、音声選択方法及びプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20080701 |
|
| PG1501 | Laying open of application | ||
| A201 | Request for examination | ||
| PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20130624 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20080701 Comment text: Patent Application |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20140609 Patent event code: PE09021S01D |
|
| E601 | Decision to refuse application | ||
| PE0601 | Decision on rejection of patent |
Patent event date: 20141022 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20140609 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |