CN107169067A

CN107169067A - 一种利用语音查询汉字的字典检索方法及系统

Info

Publication number: CN107169067A
Application number: CN201710312776.0A
Authority: CN
Inventors: 范剑淼; 孔祥顺
Original assignee: Shanghai Ming Digital Publishing Technology Co Ltd
Current assignee: Shanghai Ming Digital Publishing Technology Co Ltd
Priority date: 2017-05-05
Filing date: 2017-05-05
Publication date: 2017-09-15

Abstract

本发明公开了一种利用语音查询汉字的字典检索方法，包括以下步骤：获取含有目标汉字的语音输入信息；对语音输入信息进行识别并匹配出候选汉字；从候选汉字中选择目标汉字进行检索；一种利用语音查询汉字的字典检索系统，包括语音输入模块、语音识别模块、检索模块、数据库模块。利用包含目标汉字的多音节词语、短语或句子进行语音输入，再将语音进行识别匹配，在语音识别结果输出之前先把最大可能匹配汉字转换为一组音节序列并进行同音节词语或短语的映射，将映射的同音节词语或短语连同之前识别的汉字与中文编码字符集映射输出，可有效减少目标待查汉字的同音字对目标汉字的干扰，用户的候选字数量大幅下降，从而可以实现更高效的字典检索。

Description

一种利用语音查询汉字的字典检索方法及系统

技术领域

本发明涉及电子字典检索方法，尤其涉及一种利用语音查询汉字的字典检索方法及系统。

背景技术

传统的纸质字典检索是利用拼音或部首的方式进行检索。而随着人们工作、学习方式的改变以及移动互联网技术的快速发展，目前人们学习的方式正由传统的纸质逐渐转向电子式学习，通过移动终端进行电子式学习，使人们可以随时随地的学习，为此纸质字典也进行了电子字典的拓展。

现有的中文电子字典查询方法需要先输入待查询的字，才能查到该字的解释，不会拼音、输入法选字繁琐等都会给检索造成不便甚至不能完成检索，因而市场需要电子字典检索的进一步改进，或出现一种新的检索方式；

已经出现的有语音识别进行检索的方式。然而，中文拼音有4个单调，汉字、拼音、音调、语境造就了中文的博大精深，但这也不可避免的形成了不同的汉字的拼音和音调一致，也就是所谓的同音字，中文的汉字因此有很多都具有同音字。比如在商务印书馆出版的第11版《新华字典》中，经官方统计，共收录了包括繁体字和异体字在内的共计约13720个汉字，而汉字的不带声调的音节数量约为416个，即使带声调后的音节也只有1327个。根据不带声调的音节归并同音字，那么13720个汉字中的12794个汉字以音节进行查询时都会有超过10个以上的同音字作为目标待查汉字的干扰项，其中最多的一个有300个以上的同音字。

通过识别单个目标汉字发音的方式来输入目标待查汉字时，会由于大量同音字的存在而出现输入效率低下的问题。

而对于一本字典，字是其最重要的查询项，现有的字典只能提供词语或句子的语音输入查询，针对单个汉字的语音输入查询因为效率较低而较少使用。

一般的单音节检索方法，根据候选字的常见频率来展示候选字，这种展示对于词典用户效果不佳，原因是大部分字典使用者都是想查低频字、不认识或生僻字等非常见的字；因此一个更准确的理解用户查词目的，以尽量减少用户候选字数量的方法非常有必要，如何快速的筛选出待查汉字提高检索效率也十分必要。

发明内容

鉴于目前存在的上述不足，本发明提供一种利用语音查询汉字的字典检索方法及系统，能够在线语音识别检索对应的汉字，利用含有目标待查汉字的词语、短语或句子的方式进行查询，大大提高了检索的效率，检索速度快，便捷性高。

为达到上述目的，本发明的实施例采用如下技术方案：

一种利用语音查询汉字的字典检索方法，所述利用语音查询汉字的字典检索方法包括以下步骤：

获取含有目标汉字的语音输入信息；

对语音输入信息进行识别并匹配出候选汉字；

从候选汉字中选择目标汉字进行检索。

依照本发明的一个方面，所述含有目标汉字的语音输入信息为：含有目标汉字的词语或短语或句子语音。

依照本发明的一个方面，所述获取含有目标汉字的语音输入信息包括：通过语音输入模块提示用户输入含目标汉字的词语或短语或句子语音，并通过该语音输入模块获取用户输入的语音信息。

依照本发明的一个方面，所述对语音信息进行识别并匹配出候选汉字包括：

对所述语音输入信息进行语音识别处理，以获得与所述语音输入信息相对应的语言字符串；

根据所述语言字符串，在与对应的输入词库中进行匹配查询，以获得与所述语言字符串相匹配的一个或多个输入候选文本；

将所述一个或多个输入候选文本中至少一个提供给用户为候选汉字。

进行语音识别，获得一段最大可能性的词语、短语或者句子的汉字序列；

将该汉字序列的重复汉字过滤得到一个不重复的汉字序列；

将该汉字序列在前端输出为候选汉字。

将该汉字序列的重复汉字过滤得到一个不重复的汉字序列；

将获得的汉字序列转换成一组或多组音节序列；

将该音节序列与已构建的词语库、短语库内词语或短语的音节序列进行匹配；

将最开始识别出的汉字连同映射匹配的同音节词语或短语中的汉字一同在前端输出为候选汉字。

依照本发明的一个方面，所述从候选汉字中选择目标汉字进行检索包括：如候选汉字中有目标汉字，则选择目标汉字进行查字；如候选汉字中无目标汉字，则重新输入语音进行识别，直至候选汉字中有目标汉字。

依照本发明的一个方面，所述利用语音查询汉字的字典检索方法包括以下步骤：调取目标汉字解析，完成检索。

一种利用语音查询汉字的字典检索系统，所述利用语音查询汉字的字典检索系统包括：

语音输入模块，用于获取含有目标汉字的语音输入信息；

语音识别模块，用于对语音输入信息进行识别并匹配出候选汉字；

检索模块，用于从候选汉字中选择目标汉字进行检索；

数据库模块，用于提供候选汉字库。

依照本发明的一个方面，所述语音输入模块包括：输入提示模块，用于提示用户输入含目标汉字的词语或短语或句子语音。

依照本发明的一个方面，所述数据库模块包括：用于映射匹配的词语库或短语库。

本发明实施的优点：本发明所述的利用语音查询汉字的字典检索方法包括以下步骤：获取含有目标汉字的语音输入信息；对语音输入信息进行识别并匹配出候选汉字；从候选汉字中选择目标汉字进行检索；进一步的，是通过识别含有目标汉字的词语、短语或者句子的语音输入信息，由于中文存在的同音字太多，单个音节辨识度低导致检索不准确，造成单个汉字的语音检索效率低；而词语或句子中尤其是词语的辨识度高，利用包含目标汉字的多音节词语、短语或句子进行语音输入，再将语音进行识别匹配，在语音识别结果输出之前先把最大可能匹配汉字转换为一组音节序列并进行同音节词语或短语的映射，将映射的同音节词语或短语连同之前识别的汉字与中文编码字符集映射输出，供用户选择进入对应的释义检索。可有效减少目标待查汉字的同音字对目标汉字的干扰，用户的候选字数量大幅下降，从而可以实现更高效的字典检索。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例一所述的利用语音查询汉字的字典检索方法示意图；

图2为本发明实施例二所述的利用语音查询汉字的字典检索方法示意图；

图3为本发明实施例三所述的利用语音查询汉字的字典检索方法示意图；

图4为本发明实施例四所述的利用语音查询汉字的字典检索方法示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

如图1所示，一种利用语音查询汉字的字典检索方法，所述利用语音查询汉字的字典检索方法包括以下步骤：

步骤S1：获取含有目标汉字的语音输入信息；

所述步骤S1获取含有目标汉字的语音输入信息的具体实施方式可为：通过语音识别模块进行语音输入信息获取，语音识别模块是语音识别SDK插件或在线语音识别API，如基于开源语音识别引擎CMUSphinx开发的语音识别SDK插件、科大讯飞的语音识别在线API等。

在实际应用中，录入语音的语言有多种方式，优选采用普通话输入语音。

步骤S2：对语音输入信息进行识别并匹配出候选汉字；

所述步骤S2对语音输入信息进行识别并匹配出候选汉字包括：

步骤S3：从候选汉字中选择目标汉字进行检索。

在实际应用中，检索载体字典是一种电子字典，包括在线字典和离线字典。

在实际应用中，从候选汉字中选择目标汉字进行检索包括：如候选汉字中有目标汉字，则选择目标汉字进行查字；如候选汉字中无目标汉字，则重新输入语音进行识别，直至候选汉字中有目标汉字。

实施例二

如图2所示，一种利用语音查询汉字的字典检索方法，所述利用语音查询汉字的字典检索方法包括以下步骤：

步骤S1：获取含有目标汉字的语音输入信息；

在实际应用中，所述含有目标汉字的语音输入信息为：含有目标汉字的词语或短语或句子语音。通过语音输入模块提示用户输入含目标汉字的词语或短语或句子语音，并通过该语音输入模块获取用户输入的语音信息。

步骤S2：对语音输入信息进行识别并匹配出候选汉字；

对语音信息进行识别并匹配出候选汉字包括：

将该汉字序列的重复汉字过滤得到一个不重复的汉字序列；

将该汉字序列在前端输出为候选汉字。

利用词语或短语检索时，通过转换的一组音节反向检索同音词语或短语，将可能的同音词语或短语一并输出，避免只选一个词语或短语造成的目标汉字包含失败，提高了检索的效率。

可以根据需要自动屏蔽或跳过常用字的输出，直接输出不常用的字。

步骤S3：从候选汉字中选择目标汉字进行检索。

实施例三

如图3所示，一种利用语音查询汉字的字典检索方法，所述利用语音查询汉字的字典检索方法包括以下步骤：

步骤S1：获取含有目标汉字的语音输入信息；

步骤S2：对语音输入信息进行识别并匹配出候选汉字；

将该汉字序列的重复汉字过滤得到一个不重复的汉字序列；

将获得的汉字序列转换成一组或多组音节序列；

所述词语库、短语库，为电子形式存储的词语库、短语库，收录了现有的词语、短语。

所述的词语库、短语库可在后台实时更新。

所述的词语，为包含至少两个汉字的词语，可以是成语，也可以是实词、虚词以及包含有实词或虚词的词语，实词包括名词、动词、形容词、数词、量词；虚词包括副词、介词、连词、助词、拟声词和叹词。

所述的短语，包括主谓短语、动宾短语、偏正短语、补语、联合短语以及其他短语。

所述的词语库、短语库采用现有的数据库技术进行构建，比如可以采用SQLite、Oracle、CDB数据库等现有的数据库技术建库，CDBSQLite数据库是一种云开源的轻量级关系型数据库，简易的CDB数据库包括索引和数据文件，索引主键为音节序列，为一个key键，Value值键内存储着数据文件，数据文件包括名称、类型、音节等等键，转换的一串音节与key键匹配再指向对应的Value值并与其中的音节匹配，Value值中的音节映射有对应的词语或短语，遍历词语库或短语库完成同音节词语或短语的匹配。所述key键包括key值、数据指针和下一条记录的Key记录指针，数据指针指向数据文件中具体Value值的记录位置。所述索引和数据文件是分离的，这样动态扩容的时候不用做太多数据迁移和位置计算。

所述的句子，由字和词语组成，是具有一定语调并表达一个完整意思的语言单位。

步骤S3：从候选汉字中选择目标汉字进行检索。

实施例四

如图4所示，一种利用语音查询汉字的字典检索方法，所述利用语音查询汉字的字典检索方法包括以下步骤：

步骤S1：获取含有目标汉字的语音输入信息；

步骤S2：对语音输入信息进行识别并匹配出候选汉字；

将该汉字序列的重复汉字过滤得到一个不重复的汉字序列；

将获得的汉字序列转换成一组或多组音节序列；

所述的词语库、短语库可在后台实时更新。

步骤S3：从候选汉字中选择目标汉字进行检索。

步骤S4：调取目标汉字解析，完成检索。

实施例五

语音输入模块，用于获取含有目标汉字的语音输入信息；

检索模块，用于从候选汉字中选择目标汉字进行检索；

数据库模块，用于提供候选汉字库。

在实际应用中，所述语音输入模块包括：输入提示模块，用于提示用户输入含目标汉字的词语或短语或句子语音。

在实际应用中，所述数据库模块包括：用于映射匹配的词语库或短语库。

实施例六

汉字的词语、短语语音检索

目标待查汉字“羁”；

用户想知道“羁”的解释及常用方式，进行“羁”的字典检索，用户先用“羁”组成一个词语“羁押”。

输入语音采用具有语音识别功能的终端或移动终端自带、自装的语音识别模块。

利用语音识别模块输入“羁押”的语音，目标汉字“羁”。

如语音识别最可能的结果是“积压”，则将“积压”转换为音节[jīyā]，再将这一音节[jīyā]与构建的词语库、短语库内的词语或短语音节进行匹配，匹配出同音节的词语“羁押”，然后把“羁押”、“积压”与字符编码映射输出一组汉字“积、压、羁、押”，选择目标汉字“羁”进入检索。

如果未识别得到目标汉字，则再次组词输入语音，经过一次或多次循环输出含有目标汉字“羁”的匹配结果。

匹配结果在前端输出一组含有目标汉字“羁”的结果，选择目标汉字检索进入对应的释义内容。

实施例七

汉字的句子语音检索

目标待查汉字“怼”；

用户想了解“怼”的释义，进行“怼”的在线词典检索，用户需先用“怼”组合一个句子，如：我今天又被怼了。

通过语音识别模块输入“我今天又被怼了”的语音；

语音分析模块按句子进行分析语音，分解其中的词语“今天”并提取出来，再对剩余部分进行分解，进行识别并与字符编码匹配，逐字显示的结果之一是“我、今、天、又、被、怼、了”，结果也可以是“我、今、天、又、被、对、了”，输出最大可能汉字“我、今、天、又、被、怼、了”，如显示的结果无目标汉字，则重新组词，循环进行S1、S2步骤，直至出现目标汉字“怼”。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本领域技术的技术人员在本发明公开的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种利用语音查询汉字的字典检索方法，其特征在于，所述利用语音查询汉字的字典检索方法包括以下步骤：

获取含有目标汉字的语音输入信息；

对语音输入信息进行识别并匹配出候选汉字；

从候选汉字中选择目标汉字进行检索。

2.根据权利要求1所述的利用语音查询汉字的字典检索方法，其特征在于，所述含有目标汉字的语音输入信息为：含有目标汉字的词语或短语或句子语音。

3.根据权利要求2所述的利用语音查询汉字的字典检索方法，其特征在于，所述获取含有目标汉字的语音输入信息包括：通过语音输入模块提示用户输入含目标汉字的词语或短语或句子语音，并通过该语音输入模块获取用户输入的语音信息。

4.根据权利要求1所述的利用语音查询汉字的字典检索方法，其特征在于，所述对语音信息进行识别并匹配出候选汉字包括：

5.根据权利要求2所述的利用语音查询汉字的字典检索方法，其特征在于，所述对语音信息进行识别并匹配出候选汉字包括：

将该汉字序列的重复汉字过滤得到一个不重复的汉字序列；

将该汉字序列在前端输出为候选汉字。

6.根据权利要求2所述的利用语音查询汉字的字典检索方法，其特征在于，所述对语音信息进行识别并匹配出候选汉字包括：

将该汉字序列的重复汉字过滤得到一个不重复的汉字序列；

将获得的汉字序列转换成一组或多组音节序列；

7.根据权利要求1至6之一所述的利用语音查询汉字的字典检索方法，其特征在于，所述从候选汉字中选择目标汉字进行检索包括：如候选汉字中有目标汉字，则选择目标汉字进行查字；如候选汉字中无目标汉字，则重新输入语音进行识别，直至候选汉字中有目标汉字。

8.根据权利要求7所述的利用语音查询汉字的字典检索方法，其特征在于，所述利用语音查询汉字的字典检索方法包括以下步骤：调取目标汉字解析，完成检索。

9.一种利用语音查询汉字的字典检索系统，其特征在于，所述利用语音查询汉字的字典检索系统包括：

语音输入模块，用于获取含有目标汉字的语音输入信息；

检索模块，用于从候选汉字中选择目标汉字进行检索；

数据库模块，用于提供候选汉字库。

10.根据权利要求9所述的利用语音查询汉字的字典检索系统，其特征在于，所述语音输入模块包括：输入提示模块，用于提示用户输入含目标汉字的词语或短语或句子语音；所述数据库模块包括：用于映射匹配的词语库或短语库。