[go: up one dir, main page]

CN102237088B - 语音识别多信息文本获取装置及方法 - Google Patents

语音识别多信息文本获取装置及方法 Download PDF

Info

Publication number
CN102237088B
CN102237088B CN2011101651010A CN201110165101A CN102237088B CN 102237088 B CN102237088 B CN 102237088B CN 2011101651010 A CN2011101651010 A CN 2011101651010A CN 201110165101 A CN201110165101 A CN 201110165101A CN 102237088 B CN102237088 B CN 102237088B
Authority
CN
China
Prior art keywords
information
text
speech recognition
intensity
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2011101651010A
Other languages
English (en)
Other versions
CN102237088A (zh
Inventor
张峰
黄伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI GEAK ELECTRONICS Co.,Ltd.
Original Assignee
Shengle Information Technolpogy Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shengle Information Technolpogy Shanghai Co Ltd filed Critical Shengle Information Technolpogy Shanghai Co Ltd
Priority to CN2011101651010A priority Critical patent/CN102237088B/zh
Publication of CN102237088A publication Critical patent/CN102237088A/zh
Application granted granted Critical
Publication of CN102237088B publication Critical patent/CN102237088B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种语音识别多信息文本获取装置及方法,在通过语音识别将语音音频转换为纯文本信息之后,还将语音音频中的单字发音语速、单字发音强度、单字发音语调通过一定表现方式整合至初始生成的纯文本信息中生成多信息的文本信息。本发明的语音识别多信息文本获取装置及方法可广泛应用于微博、短信和签名档等信息发布平台。

Description

语音识别多信息文本获取装置及方法
技术领域
本发明涉及计算机语音识别技术领域,特别涉及一种语音识别多信息文本获取装置及方法。
背景技术
近二十年来,语音识别技术取得显著进步,已经获得越来越广泛的应用。预计在未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。
所谓语音识别,是指计算机或机械等自动理解人的语音。例如,通过利用语音识别,使计算机或机械能够根据人的语音进行动作,或者能够使人的语音变换为文字。语音识别中主要采用的方法是,抽取发出的语音所具有的频谱等物理特征,与预先存储的母音、子音或单词的物理特征模型进行比较,最终得到同人的语音内容相同的表达信息。但现有技术中,通过语音识别技术获取的文本信息通常只能是纯文本信息,所述纯文本信息是指文字大小格式统一、除标点符号外没有特殊符号的文本信息,说明书中所有提及纯文本信息之处均指此意。因此语音中的很多有价值的信息,例如说话人的语速、重音、音调等信息,无法在语音识别后的纯文本信息中表现出来。
发明内容
本发明要解决的技术问题是提供一种语音识别多信息文本获取装置及方法,以解决现有技术中通过语音识别技术获取的文本信息通常只能是纯文本信息,语音中的很多有价值的信息无法在语音识别后的文本信息中变现出来的问题。
为解决上述技术问题,本发明提供一种语言识别多信息文本获取装置,包括:
纯文本信息及单字发音时间生成模块,用于通过语音识别将语音音频转换为纯文本信息,同时用于获得语音音频中的单字发音时间,通过所述单字发音时间的长短确定单字发音语速;
多信息文本生成模块,用于将所述纯文本信息生成多信息的文本信息。
可选的,还包括单字发音强度计算模块,用于依据所述单字发音时间计算得到单字发音强度。
可选的,所述多信息文本生成模块用于在所述纯文本信息中整合所述单字发音语速和/或所述单字发音强度的信息生成多信息的文本信息。
可选的,还包括单字语调计算模块,用于依据所述单字发音时间计算得到单字发音语调。
可选的,所述多信息文本生成模块用于在所述纯文本信息中整合所述单字发音语速和/或所述单字发音强度和/或单字发音语调的信息生成多信息的文本信息。
本发明还提供一种语音识别多信息文本获取方法,包括以下步骤:
步骤一,通过语音识别将语音音频转换为纯文本信息,同时获得语音音频中的单字发音时间,进而通过所述单字发音时间的长短确定单字发音语速;
步骤二,将所述纯文本信息生成多信息的文本信息。
可选的,所述步骤二中,在所述纯文本信息中整合所述单字发音语速的信息生成多信息的文本信息。
可选的,在所述步骤一和步骤二之间还包括依据所述单字发音时间计算得到单字发音强度和/或单字发音语调的步骤。
可选的,所述步骤二中,在所述纯文本信息中整合所述单字发音语速和/或所述单字发音强度和/或所述单字发音语调的信息生成多信息的文本信息。
可选的,所述单字发音语调利用所述单字发音时间通过基频提取技术计算得到。
可选的,所述单字发音强度通过计算所述单字发音时间内发音强度的均值而得到。
本发明的语音识别多信息文本获取装置及方法在通过语音识别将语音音频转换为纯文本信息之后,还将语音音频中的单字发音语速、单字发音强度、单字发音语调通过一定表现方式整合至初始生成的纯文本信息中生成多信息的文本信息。本发明的语音识别多信息文本获取装置及方法可广泛应用于微博、短信和签名档等信息发布平台。
附图说明
图1为本发明的语音识别多信息文本获取装置的一实施例架构示意图;
图2为本发明的语音识别多信息文本获取装置的另一实施例架构示意图;
图3为本发明的语音识别多信息文本获取方法一实施例流程示意图;
图4为本发明的语音识别多信息文本获取方法另一实施例流程示意图;
图5为本发明的一种多信息的文本信息的示意图;
图6为本发明的另一种多信息的文本信息的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面对本发明的具体实施方式做详细的说明。
本发明所述的多信息的文本信息表示系统及方法可利用多种替换方式实现,下面是通过较佳的实施例来加以说明,当然本发明并不局限于该具体实施例,本领域内的普通技术人员所熟知的一般的替换无疑涵盖在本发明的保护范围内。
本发明提供一种语言识别多信息文本获取装置。
实施例一
请参看图1,图1为本发明的语音识别多信息文本获取装置的一实施例架构示意图。如图1所示,本发明的语音识别多信息文本获取装置包括:
纯文本信息及单字发音时间生成模块,用于通过语音识别将语音音频转换为纯文本信息,同时用于获得语音音频中的单字发音时间,即单字发音的开始时间和结束时间,进而通过所述单字发音时间的长短确定单字发音语速。所述单字发音时间在语音识别的过程中随着将语音音频转换为纯文本信息的同时自动得到。
多信息文本生成模块,用于在所述纯文本信息中整合单字发音语速的信息生成多信息的文本信息。
依据得到的单字发音语速,通过变化纯文本信息中的文字间距或文字宽度来表示语速,或者通过加入符号来表示语速,或者以上几种方法的结合。
例如,通过所述语音识别纯文本信息生成模块的生成得到的纯文本信息为:好爽啊,抽奖抽到手机了。
通过变化纯文本信息的文字间距表示语速,得到多信息的文本信息:好爽啊,抽奖抽到手机了。
通过变化纯文本信息的文字宽度表示语速,得到多信息的文本信息:好爽啊,抽奖抽到手机了。
通过在纯文本信息中加入符号来表示语速,得到多信息的文本信息:好~~爽啊,抽奖~抽到手机~~了。
实施例二
请参看图2,图2为本发明的语音识别多信息文本获取装置的另一实施例架构示意图。如图2所示,本发明的语音识别多信息文本获取装置包括:
纯文本信息及单字发音时间生成模块,用于通过语音识别将语音音频转换为纯文本信息,同时用于获得语音音频中的单字发音时间,即单字发音的开始时间和结束时间,进而通过所述单字发音时间的长短确定单字发音语速。所述单字发音时间在语音识别的过程中随着将语音音频转换为纯文本信息的同时自动得到。
单字发音强度计算模块,用于依据得到的单字发音时间计算得到单字发音强度。利用获得的所述单字发音时间,计算单字发音时间段内发音强度的均值,可以得到每个字的发音强度。
单字语调计算模块,用于依据得到的单字发音时间计算得到单字发音语调。所述单字发音语调通过基频提取技术得到。基频提取技术中的基频是指发音过程中发浊音时声带振动的频率。现有技术中已有多种基频提取算法,主要有时域的自相关法、频域的倒谱法等等。
多信息文本生成模块,用于在所述纯文本信息中整合单字发音语速、和/或单字发音强度、和/或单字发音语调的信息生成多信息的文本信息。所述多信息的文本信息为包含有表示发音语速和/或发音语调和/或发音强度含义内容的文本信息。
1)依据得到的单字发音语速,通过变化纯文本信息中的文字间距或文字宽度来表示语速,或者通过加入符号来表示语速,或者以上几种方法的结合。
例如,通过所述语音识别纯文本信息生成模块的生成得到的纯文本信息为:好爽啊,抽奖抽到手机了。
通过变化纯文本信息的文字间距表示语速,得到多信息的文本信息:好爽啊,抽奖抽到手机了。
通过变化纯文本信息的文字宽度表示语速,得到多信息的文本信息:好爽啊,抽奖抽到手机了。
通过在纯文本信息中加入符号来表示语速,得到多信息的文本信息:好~~爽啊,抽奖~抽到手机~~了。
2)依据得到的单字发音强度,通过变化纯文本信息中的文字大小或文字颜色或文字字体粗细来表示发音强度,或者以上方法的结合。
例如,通过所述语音识别纯文本信息生成模块的处理后得到的纯文本信息为:好爽啊,抽奖抽到手机了。
通过变化纯文本信息的文字大小表示发音强度,得到多信息的文本信息:好爽啊,抽奖抽到手机了。
通过变化纯文本信息的文字颜色表示发音强度,得到多信息的文本信息:好(红色)爽啊(蓝色),抽(棕色)奖抽(红色)到手机(红色)了。
通过变化纯文本信息的文字字体粗细表示发音强度,得到多信息的文本信息:好爽啊,抽奖抽到手机了。
3)依据得到的单字发音语调,通过在纯文本信息中的每个字的上部或下部加入曲线表示发音语调。
例如,通过所述语音识别纯文本信息生成模块的处理后得到的纯文本信息为:好爽啊,抽奖抽到手机了。
通过在纯文本信息中文字上部或下部加入代表发音语调的曲线,得到如图5所示的多信息的文本信息。
4)同时使用上述1)至3)中描述的方法,将单字发音语速、单字发音强度和单字发音语调都整合至纯文本信息中生成多信息的文本信息。
例如,通过所述语音识别纯文本信息生成模块的处理后得到的纯文本信息为:好爽啊,抽奖抽到手机了。
最终生成如图6所示的多信息文本信息。
本发明还提供一种语音识别多信息文本获取方法。
实施例三
请参看图3,图3为本发明的语音识别多信息文本获取方法一实施例流程示意图。如图3所示,本发明提供一种语音识别多信息文本获取方法,包括以下步骤:
步骤一,通过语音识别将语音音频转换为纯文本信息,同时获得语音音频中的单字发音时间,即单字发音的开始时间和结束时间,进而通过所述单字发音时间的长短确定单字发音的语速。所述单字发音时间在语音识别的过程中随着将语音音频转换为纯文本信息的同时自动得到。
步骤二,在所述纯文本信息中整合单字发音语速的信息生成多信息的文本信息。
实施例四
请参看图4,图4为本发明的语音识别多信息文本获取方法另一实施例流程示意图。如图4所示,本发明提供一种语音识别多信息文本获取方法,包括以下步骤:
步骤一,通过语音识别将语音音频转换为纯文本信息,同时获得语音音频中的单字发音时间,即单字发音的开始时间和结束时间,进而通过所述单字发音时间的长短确定单字发音的语速。所述单字发音时间在语音识别的过程中随着将语音音频转换为纯文本信息的同时自动得到。
步骤二,依据得到的单字发音时间计算得到单字发音强度和/或单字发音语调。
计算所述单字发音强度时,利用获得的所述单字发音时间,计算单字发音时间段内发音强度的均值,可以得到每个字的发音强度。
所述单字发音语调通过基频提取技术计算得到。
步骤三,在所述纯文本信息中整合单字发音语速、和/或单字发音强度、和/或单字发音语调的信息生成多信息的文本信息。
本发明的语音识别多信息文本获取装置及方法在通过语音识别将语音音频转换为纯文本信息之后,还将语音音频中的单字发音语速、单字发音强度、单字发音语调通过一定表现方式整合至初始生成的纯文本信息中生成多信息的文本信息。本发明的语音识别多信息文本获取装置及方法可广泛应用于微博、短信和签名档等信息发布平台。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1.一种语言识别多信息文本获取装置,其特征在于,包括:
纯文本信息及单字发音时间生成模块,用于通过语音识别将语音音频转换为纯文本信息,同时用于获得所述语音音频中的单字发音时间,通过所述单字发音时间的长短确定单字发音语速;
多信息文本生成模块,用于将所述纯文本信息生成多信息的文本信息,即在所述纯文本信息中整合所述单字发音语速和/或单字发音强度和/或单字发音语调的信息生成多信息的文本信息;
单字语调计算模块,用于依据所述单字发音时间计算得到单字发音语调。
2.如权利要求1所述的语言识别多信息文本获取装置,其特征在于,还包括单字发音强度计算模块,用于依据所述单字发音时间计算得到单字发音强度。
3.如权利要求2所述的语言识别多信息文本获取装置,其特征在于,所述多信息文本生成模块用于在所述纯文本信息中整合所述单字发音语速和/或所述单字发音强度的信息生成多信息的文本信息。
4.一种语音识别多信息文本获取方法,其特征在于,包括以下步骤:
步骤一,通过语音识别将语音音频转换为纯文本信息,同时获得语音音频中的单字发音时间,进而通过所述单字发音时间的长短确定单字发音语速;
步骤二,将所述纯文本信息生成多信息的文本信息;
在所述步骤一和步骤二之间还包括依据所述单字发音时间计算得到单字发音强度和/或单字发音语调的步骤;
所述步骤二中,在所述纯文本信息中整合所述单字发音语速和/或所述单字发音强度和/或所述单字发音语调的信息生成多信息的文本信息。
5.如权利要求4所述的语音识别多信息文本获取方法,其特征在于,所述步骤二中,在所述纯文本信息中整合所述单字发音语速的信息生成多信息的文本信息。
6.如权利要求4所述的语音识别多信息文本获取方法,其特征在于,所述单字发音语调利用所述单字发音时间通过基频提取技术计算得到。
7.如权利要求4所述的语音识别多信息文本获取方法,其特征在于,所述单字发音强度通过计算所述单字发音时间内发音强度的均值而得到。
CN2011101651010A 2011-06-17 2011-06-17 语音识别多信息文本获取装置及方法 Active CN102237088B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011101651010A CN102237088B (zh) 2011-06-17 2011-06-17 语音识别多信息文本获取装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011101651010A CN102237088B (zh) 2011-06-17 2011-06-17 语音识别多信息文本获取装置及方法

Publications (2)

Publication Number Publication Date
CN102237088A CN102237088A (zh) 2011-11-09
CN102237088B true CN102237088B (zh) 2013-10-23

Family

ID=44887675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011101651010A Active CN102237088B (zh) 2011-06-17 2011-06-17 语音识别多信息文本获取装置及方法

Country Status (1)

Country Link
CN (1) CN102237088B (zh)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
CN101923734B (zh) * 2010-07-15 2012-07-04 严皓 基于移动网络的高速公路车辆行驶路径识别系统的实现方法
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
TWI484475B (zh) * 2012-06-05 2015-05-11 Quanta Comp Inc 文字顯示方法與語音轉文字裝置以及電腦程式產品
DE112014000709B4 (de) 2013-02-07 2021-12-30 Apple Inc. Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
HK1220268A1 (zh) 2013-06-09 2017-04-28 苹果公司 用於實現跨數字助理的兩個或更多個實例的會話持續性的設備、方法、和圖形用戶界面
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN103310273A (zh) * 2013-06-26 2013-09-18 南京邮电大学 基于diva模型的带声调的汉语元音发音方法
KR101749009B1 (ko) 2013-08-06 2017-06-19 애플 인크. 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화
CN104518951B (zh) * 2013-09-29 2017-04-05 腾讯科技(深圳)有限公司 一种回复社交应用信息的方法及装置
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10186282B2 (en) * 2014-06-19 2019-01-22 Apple Inc. Robust end-pointing of speech signals using speaker recognition
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
CN105353957A (zh) * 2015-10-28 2016-02-24 深圳市金立通信设备有限公司 一种信息显示方法及终端
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US12223282B2 (en) 2016-06-09 2025-02-11 Apple Inc. Intelligent automated assistant in a home environment
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
CN108133706B (zh) * 2017-12-21 2020-10-27 深圳市沃特沃德股份有限公司 语义识别方法及装置
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
CN110830852B (zh) * 2018-08-07 2022-08-12 阿里巴巴(中国)有限公司 一种视频内容的处理方法及装置
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. User activity shortcut suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11043220B1 (en) 2020-05-11 2021-06-22 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
CN111611208A (zh) * 2020-05-27 2020-09-01 北京太极华保科技股份有限公司 文件存储与查询的方法及装置、存储介质
CN112530213B (zh) * 2020-12-25 2022-06-03 方湘 一种汉语音调学习方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1336634A (zh) * 2000-07-28 2002-02-20 国际商业机器公司 根据基音信息识别声调语言的方法与设备
JP2004212665A (ja) * 2002-12-27 2004-07-29 Toshiba Corp 話速可変装置及び話速変換方法
US7155391B2 (en) * 2000-07-31 2006-12-26 Micron Technology, Inc. Systems and methods for speech recognition and separate dialect identification
CN101777347A (zh) * 2009-12-07 2010-07-14 中国科学院自动化研究所 一种模型互补的汉语重音识别方法及系统
JP2011014021A (ja) * 2009-07-03 2011-01-20 Nippon Hoso Kyokai <Nhk> 文字情報提示制御装置及びプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101462932B1 (ko) * 2008-05-28 2014-12-04 엘지전자 주식회사 이동 단말기 및 그의 텍스트 수정방법
CN101727900A (zh) * 2009-11-24 2010-06-09 北京中星微电子有限公司 一种用户发音检测方法及设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1336634A (zh) * 2000-07-28 2002-02-20 国际商业机器公司 根据基音信息识别声调语言的方法与设备
US7155391B2 (en) * 2000-07-31 2006-12-26 Micron Technology, Inc. Systems and methods for speech recognition and separate dialect identification
JP2004212665A (ja) * 2002-12-27 2004-07-29 Toshiba Corp 話速可変装置及び話速変換方法
JP2011014021A (ja) * 2009-07-03 2011-01-20 Nippon Hoso Kyokai <Nhk> 文字情報提示制御装置及びプログラム
CN101777347A (zh) * 2009-12-07 2010-07-14 中国科学院自动化研究所 一种模型互补的汉语重音识别方法及系统

Also Published As

Publication number Publication date
CN102237088A (zh) 2011-11-09

Similar Documents

Publication Publication Date Title
CN102237088B (zh) 语音识别多信息文本获取装置及方法
CN102723080B (zh) 一种语音识别测试系统及方法
CN105304080B (zh) 语音合成装置及方法
CN112099628A (zh) 基于人工智能的vr互动方法、装置、计算机设备及介质
CN112309365A (zh) 语音合成模型的训练方法、装置、存储介质以及电子设备
CN108766441A (zh) 一种基于离线声纹识别和语音识别的语音控制方法及装置
EP2851895A3 (en) Speech recognition using variable-length context
Yuan Perception of intonation in Mandarin Chinese
CN112466287B (zh) 一种语音分割方法、装置以及计算机可读存储介质
EP1557821A3 (en) Segmental tonal modeling for tonal languages
CN102089804A (zh) 声音合成模型生成装置、声音合成模型生成系统、通信终端以及声音合成模型生成方法
WO2004100126A3 (en) Method for statistical language modeling in speech recognition
JP2010157081A (ja) 応答生成装置及びプログラム
EP1280137A1 (en) Method for speaker identification
CN113539239A (zh) 语音转换方法、装置、存储介质及电子设备
CN108109610B (zh) 一种模拟发声方法及模拟发声系统
KR20180057970A (ko) 음성감성 인식 장치 및 방법
ATE514162T1 (de) Dynamische erzeugung von kontexten zur spracherkennung
CN104361787A (zh) 信号转换系统和信号转换方法
CN108831503B (zh) 一种口语评测方法及装置
Cooke Discovering consistent word confusions in noise.
CN102541504A (zh) 语音文字转换装置及方法
Greif Contrastive focus in mandarin Chinese
CN112071299B (zh) 神经网络模型训练方法、音频生成方法及装置和电子设备
CN103366732A (zh) 语音播报方法及装置、车载系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: SHANGHAI GUOKE ELECTRONIC CO., LTD.

Free format text: FORMER OWNER: SHENGYUE INFORMATION TECHNOLOGY (SHANGHAI) CO., LTD.

Effective date: 20140210

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20140210

Address after: 201203 Shanghai Guo Shou Jing Road, Zhangjiang hi tech Park No. 356 building 3 room 127

Patentee after: Shanghai Guoke Electronic Co., Ltd.

Address before: 201203 Shanghai City, Pudong New Area Shanghai City, Guo Shou Jing Road, Zhangjiang hi tech Park No. 356 building 3 Room 102

Patentee before: Shengle Information Technology (Shanghai) Co., Ltd.

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 127, building 3, 356 GuoShouJing Road, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai, 200120

Patentee after: SHANGHAI GEAK ELECTRONICS Co.,Ltd.

Address before: Room 127, building 3, 356 GuoShouJing Road, Zhangjiang hi tech park, Shanghai, 201203

Patentee before: Shanghai Nutshell Electronics Co.,Ltd.