CN101625678B - Spell checking system and method thereof - Google Patents
Spell checking system and method thereof Download PDFInfo
- Publication number
- CN101625678B CN101625678B CN2008101323264A CN200810132326A CN101625678B CN 101625678 B CN101625678 B CN 101625678B CN 2008101323264 A CN2008101323264 A CN 2008101323264A CN 200810132326 A CN200810132326 A CN 200810132326A CN 101625678 B CN101625678 B CN 101625678B
- Authority
- CN
- China
- Prior art keywords
- english
- words
- word
- check
- those
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
一种拼写检查系统及其方法,通过对比使用者输入的字词与拼写检查字词的字母、相邻字母以及首字母是否相同,并且判断使用者输入的字词与拼写检查字词不相同的字母操作上的关联性,进行权重值累计,依照权重值的大小顺序对拼写检查字词重新排序。该系统及其方法解决了现有技术中拼写检查无法提供较为合适的拼写检查字词顺序的问题,对拼写检查字词重新排序,从而提供使用者较合适的拼写检查结果。
A spelling check system and method thereof, by comparing the letters, adjacent letters and first letters of a word input by a user and a spelling check word, and judging the relevance of the letters of the word input by the user and the spelling check word that are different in operation, weight values are accumulated, and the spelling check words are reordered in the order of the weight values. The system and method thereof solve the problem that the spelling check in the prior art cannot provide a more appropriate spelling check word order, and reorder the spelling check words, thereby providing the user with a more appropriate spelling check result.
Description
技术领域technical field
本发明涉及一种拼写检查系统及其方法,尤其涉及一种依据权重值对字词排序的拼写检查系统及其方法。 The invention relates to a spelling checking system and method thereof, in particular to a spelling checking system and a method thereof for sorting words according to weight values. the
背景技术Background technique
在一些文字处理软件中,为了解决使用者在撰写过程中所产生的错别字问题,通常都具有拼写检查的功能,以提供用户在撰写时候的错别字检查。 In some word processing software, in order to solve the problem of typos generated by the user during the writing process, there is usually a spell checking function to provide the user with a typo check when writing. the
一般的拼写检查分为语音匹配算法以及字符串相似性算法,所谓的语音匹配算法即为将用户所输入的错别字依照读音转换为代码,再依据该代码找出相似的字词,提供使用者选择;字符串相似性算法即为检查字库中的字词转换成目标单词(即为使用者所输入的错别字),对其中的字母进行对比的方法,从而找到字母差异最小的方法,基本上属于一种穷举法。 General spell checking is divided into phonetic matching algorithm and string similarity algorithm. The so-called phonetic matching algorithm is to convert the typos entered by the user into codes according to the pronunciation, and then find similar words based on the codes, and provide users with choices. ; The string similarity algorithm is to check the words in the font library and convert them into target words (that is, typos entered by the user), and compare the letters in it, so as to find the method with the smallest letter difference, which basically belongs to a kind of brute force method. the
不论采用语音匹配算法或是字符串相似性算法,提供给用户所选择的待选择字词,通常都是通过字母的顺序加以排序,再显示给用户进行选择,而这种对于待选择字词的排列顺序,并无法将最适合的待选择字词放置于列表中的第一位置,提供给用户选择,使用者必须再次浏览待选择字词列表,才能找到所要的检查字词。 Regardless of the voice matching algorithm or the string similarity algorithm, the words to be selected provided to the user are usually sorted by alphabetical order, and then displayed to the user for selection. The order of arrangement does not allow the most suitable word to be selected to be placed at the first position in the list for the user to choose. The user must browse the list of words to be selected again to find the word to be checked. the
综上所述,可知现有技术中长期以来一直存在拼写检查无法提供较为合适的拼写检查字词顺序的问题,因此有必要提出改进的技术手段,来解决该问题。 To sum up, it can be seen that there has been a problem in the prior art for a long time that the spelling check cannot provide a more suitable word order for the spelling check, so it is necessary to propose an improved technical means to solve this problem. the
发明内容Contents of the invention
鉴于先前技术存在的问题,本发明提出一种拼写检查系统及其方法。 In view of the problems existing in the prior art, the present invention proposes a spell checking system and method thereof. the
本发明所提出的拼写检查系统包含:输入模块、字词查找模块、字母对比模块、检查字库、字母关联模块、相邻字母对比模块、首字母对比模块、排序模块以及显示模块。 The spell checking system proposed by the present invention includes: an input module, a word search module, a letter comparison module, a check font library, a letter correlation module, an adjacent letter comparison module, an initial letter comparison module, a sorting module and a display module. the
其中,输入模块,用于接收英语字词;字词查找模块,依据英语字词的字母个数从检查字库中取出与所述英语字词的字母个数相同的至少一个检查字词;字母对比模块,用于对比英语字词与检查字词相对应位置的英文字母是否相同,当对比结果相同,则累计所对比的检查字词对应的权重值;字母关联模块,当对比英语字词与检查字词相对应位置的英文字母不相同时,判断英语字词与检查字词相对应位置的英文字母是否具有操作上的关联,当判断具有操作上的关联,则累计所对比的检查字词对应的权重值,所述英文字母之间操作上的关联是指标准键盘上每一个英文字母上下左右的英文字母即为具有操作上的关联;相邻字母对比模块,用于对比英语字词与检查字词相对应相邻位置的英文字母是否相同,当对比结果相同,则累计所对比的检查字词对应的权重值;首字母对比模块,用于对比英语字词的首字母与检查字词的首字母的英文字母是否相同,当对比结果相同,则累计所对比的检查字词对应的权重值;排序模块,依据权重值的大小顺序对检查字词进行排序;显示模块,依照排序后的检查字词顺序显示检查字词。 Wherein, the input module is used to receive English words; the word search module, according to the number of letters of the English word, takes out at least one check word that is identical with the number of letters of the English word from the check word bank; letter comparison module, used to compare whether the English letters in the corresponding positions of the English word and the check word are the same, and when the comparison results are the same, the weight value corresponding to the compared check word is accumulated; the letter association module, when comparing the English word and check When the English letters in the corresponding positions of the words are not the same, it is judged whether the English letters in the corresponding positions of the English words and the checked words have an operational connection. weight value, the operational association between the English letters means that the upper, lower, left, and right English letters of each English letter on the standard keyboard have an operational association; the adjacent letter comparison module is used for comparing English words and checking Whether the English letters corresponding to the adjacent positions of the words are the same, when the comparison results are the same, then accumulate the weight value corresponding to the checked words; Whether the English letters of the first letters are the same, when the comparison results are the same, the weight values corresponding to the compared check words are accumulated; the sorting module sorts the check words according to the order of the weight values; the display module checks according to the sorted The word order shows the checked word. the
本发明所提出的拼写检查方法包含下列步骤: The spell checking method that the present invention proposes comprises the following steps:
首先,接收英语字词;接着,依据英语字词的字母个数从检查字库中取出与所述英语字词的字母个数相同的至少一个检查字词;接着,对比英语字词与检查字词相对应位置的英文字母是否相同,当对比结果相同,则累计所对比的检查字词对应的权重值;接着,当对比英语字词与检查字词相对应位置的英文字母不相同时,判断英语字词与检查字词相对应位置的英文字母是否具有操作上的关联,当判断具有操作上的关联,则累计所对比的检查字词对应的权重值,所述英文字母之间操作上的关联是指标准键盘上每一个英文字母上下左右的英文字母即为具有操作上的关联;接着,对比英语字词与检查字词相对应相邻位置的英文字母是否相同,当对比结果相同,则累计所对比的检查字词对应的权重值;接着,对比英语字词的首字母与检查字词的首字母的英文字母是否相同,当对比结果相同,则累计所对比的检查字词对应的权重值;接着,依据权重值的大小顺序对检查字词进行排序;最后,依照排序后的检查字词顺序显示检查字词。 First, receive the English word; then, take out at least one check word with the same number of letters as the English word from the check word library according to the number of letters of the English word; then, compare the English word and the check word Whether the English letters in the corresponding positions are the same, when the comparison results are the same, the weight value corresponding to the compared check words is accumulated; then, when the English letters in the corresponding positions of the compared English words and the check words are not the same, judge the English Words and the English letters in the corresponding positions of the checked words have an operational connection. When it is judged that there is an operational connection, the weight value corresponding to the compared checked words is accumulated, and the operational connection between the English letters It means that the upper, lower, left, and right English letters of each English letter on the standard keyboard have an operational connection; then, compare the English words and check whether the English letters in the corresponding adjacent positions of the words are the same, and when the comparison results are the same, the accumulated The weight value corresponding to the checked word to be compared; then, compare whether the first letter of the English word is the same as the English letter of the first letter of the checked word, and if the comparison results are the same, then accumulate the weight value corresponding to the compared check word ; Next, sort the check words according to the order of the weight value; finally, display the check words according to the order of the sorted check words. the
本发明所提出的系统与方法如上,与现有技术之间的差异在于本发明通过对比英语字词以及检查字词的字母、相邻字母以及首字母是否相同,并且 判断英语字词以及检查字词不相同的字母操作上的关联性,进行权重值累计,依照权重值的大小顺序对查询字词重新排序,权重值较高的检查字词即为较适合的拼写检查结果,可以优先显示给用户进行选择。 The system and method proposed by the present invention are as above, and the difference with the prior art is that the present invention compares English words and checks whether the letters, adjacent letters and initial letters of the words are the same, and judges the English words and checks the words According to the relevance of different letter operations, the weight value is accumulated, and the query words are reordered according to the order of the weight value. The check word with a higher weight value is a more suitable spelling check result, which can be displayed to the The user makes a selection. the
通过上述的技术手段,本发明可以对检查字词重新排序从而提供使用者较合适的拼写检查结果。 Through the above-mentioned technical means, the present invention can reorder the checked words so as to provide users with more suitable spelling check results. the
附图说明Description of drawings
图1为本发明拼写检查系统方块图。 FIG. 1 is a block diagram of the spell checking system of the present invention. the
图2为本发明拼写检查方法流程图。 Fig. 2 is a flow chart of the spell checking method of the present invention. the
图3为本发明输入英语字词接口示意图。 Fig. 3 is a schematic diagram of the interface for inputting English words in the present invention. the
图4A至图4E为本发明拼写检查过程示意图。 4A to 4E are schematic diagrams of the spell checking process of the present invention. the
图5为本发明显示排序检查字词接口示意图。 FIG. 5 is a schematic diagram of an interface for displaying sorting and checking words in the present invention. the
具体实施方式Detailed ways
以下将配合图示及实施例来详细说明本发明的实施方式,藉此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。 The implementation of the present invention will be described in detail below with illustrations and examples, so as to fully understand and implement the implementation process of how the present invention uses technical means to solve technical problems and achieve technical effects. the
以下将说明本发明拼写检查系统,并请同时参考图1所示,图1是为本发明拼写检查系统方块图。 The spelling checking system of the present invention will be described below, and please refer to FIG. 1 , which is a block diagram of the spelling checking system of the present invention. the
如图1所示,本发明所提出的拼写检查系统包含:输入模块10、字词查找模块20、检查字库21、字母对比模块30、字母关联模块40、相邻字母对比模块50、首字母对比模块60、排序模块70以及显示模块80。 As shown in Figure 1, the spell checking system that the present invention proposes comprises:
其中,输入模块10用于输入英语字词,并将使用者输入的英语字词发送给字词查找模块20。 Wherein, the
字词查找模块20接收输入模块10所传送的英语字词,并依据英语字词的字母个数从检查字库21中取出与英语字词的字母个数相同的至少一个检查字词,字词查找模块20取出至少一个检查字词后,会将英语字词以及检查字词发送给字母对比模块30。 Word
具体来说,假设字词查找模块20所接收到的输入模块10所传送的英语 字词的字母个数为6个,则字词查找模块20会从检查字库21中,取出字母个数为6个的字词,作为与英语字词对比的检查字词,并将取出的检查字词发送给字母对比模块30。 Specifically, assuming that the number of letters of the English word sent by the
字母对比模块30用于对比英语字词与检查字词相对应位置的英文字母是否相同:当对比结果不相同时,字词查找模块20会记录该位置的英文字母对比不相同;当对比结果相同则分别累计至少一次权重值,每一个检查字词会具有相对应的权重值。对比英语字词及检查字词时,可以将英语字词同时与每一个检查字词进行对比,或是对比单一检查字词完成后,再取出下一个检查字词进行对比,所累计的权重值是分开的。
具体来说,字母对比模块30会分别依次将英语字词与检查字词中的每一个位置的英文字母一一对比是否相同,假设6个英文字母当中,对比的结果为5个位置的英文字母是相同的,则字母对比模块30将会累计5次与检查字词相对应的权重值。 Specifically, the
字母对比模块30对英语字词以及检查字词每一个位置的英文字母对比完成后,会将英语字词、检查字词以及所分别累计的权重值发送给字母关联模块40。 After the
字母关联模块40用于接收字母对比模块30所发送来的英语字词、检查字词以及所分别累计的权重值。由于字母对比模块30记录了英文字母对比不相同的位置,因此,字母关联模块40可以通过字母对比模块30得知英语字词与检查字词中英文字母不相同的位置,并由此判断英语字词与检查字词相对应位置的英文字母是否具有操作上的关联,当判断具有操作上的关联则分别累计权重值。 The
具体来说,由于字母对比模块30会记录英文字母对比不相同的位置,因此,假设字母关联模块40通过字母对比模块30得知英语字词以及检查字词在第三个位置对比英文字母的结果是不相同的,字母关联模块40会判断英语字词以及检查字词在第三个位置的英文字母是否具有操作上的关联,当具有操作上的关联时,字母关联模块40将累计与检查字词相对应的权重值。 Specifically, since the
英文字母间操作上的关联定义为标准键盘上每一个英文字母上下左右的英文字母即为具有操作上的关联,举例来说,英文字母“d”操作上的关联英 文字母为“e”、“c”、“s”以及“f”;英文字母“p”操作上的关联英文字母为“o”;英文字母“l”操作上的关联英文字母为“o”以及“k”;英文字母“z”操作上的关联英文字母为“a”以及“x”,其余英文字母可以依此类推,这里不再进行举例说明。 The operational association between English letters is defined as the upper, lower, left, and right English letters of each English letter on the standard keyboard have an operational association. "c", "s" and "f"; the associated English letter on the operation of the English letter "p" is "o"; the associated English letters on the operation of the English letter "l" are "o" and "k"; the English letter The associated English letters on the "z" operation are "a" and "x", and the rest of the English letters can be deduced in the same way, and no examples are given here. the
当字母关联模块40对英语字词以及检查字词不同英文字母的位置判断操作上的关联完成后,则将英语字词、检查字词以及所分别累计的权重值发送给相邻字母对比模块50。 After the association on the position judgment operation of English word and check word different English letters by
相邻字母对比模块50接收到字母关联模块40所发送来的英语字词、检查字词以及所分别累计的权重值后,将对比英语字词相邻位置的英文字母与检查字词相邻位置的英文字母是否相同,若对比结果相同则分别累计权重值。 After the adjacent letter comparison module 50 receives the English word, the check word and the respectively accumulated weight value that the
具体来说,假设英语字词为“abc”以及检查字词为“abd”,首先,相邻字母对比模块50会对比英语字词第一位置、第二位置的英文字母“ab”,以及检查字词第一位置、第二位置的英文字母“ab”,相邻字母对比模块50所对比的结果为相同,因此,相邻字母对比模块50将会累计与检查字词相对应的权重值;接着,相邻字母对比模块50会对比英语字词第二位置、第三位置的英文字母“bc”,以及检查字词第二位置、第三位置的英文字母“bd”,相邻字母对比模块50所对比的结果为不相同,则相邻字母对比模块50不会累计与检查字词相对应的权重值。 Specifically, assuming that the English word is "abc" and the check word is "abd", first, the adjacent letter comparison module 50 will compare the English letter "ab" in the first position and the second position of the English word, and check Word first position, the English letter " ab " of second position, the result compared by adjacent letter comparison module 50 is identical, therefore, adjacent letter comparison module 50 will accumulate the corresponding weight value with checking word; Then, the adjacent letter comparison module 50 will compare the English letter "bc" in the second position and the third position of the English word, and check the English letter "bd" in the second position and the third position of the word, and the adjacent letter comparison module If the result of the comparison at 50 is not the same, then the adjacent letter comparison module 50 will not accumulate the weight value corresponding to the checked word. the
当相邻字母对比模块50对英语字词以及检查字词每一个相邻位置的英文字母对比完成后,会将英语字词、检查字词以及所分别累计的权重值发送给首字母对比模块60。 After the adjacent letter comparison module 50 completes the comparison of the English letters in each adjacent position of the English word and the check word, the English word, the check word and the accumulated weight value will be sent to the initial
首字母对比模块60接收到相邻字母对比模块50所发送来的英语字词、检查字词以及所分别累计的权重值后,接着会对比英语字词的首字母与检查字词的首字母的英文字母是否相同,当对比结果相同则分别累计权重值。 After the initial
经过字母对比模块30、字母关联模块40、相邻字母对比模块50以及首字母对比模块60所分别累计的权重值后,检查字词以及所分别累计的权重值将被发送给排序模块70。 After the weight values accumulated by the
排序模块70接收到首字母对比模块60所发送来的检查字词以及所分别 累计的权重值,接着,排序模块70会依据权重值的大小顺序对检查字词进行排序,并将排序后的检查字词发送给显示模块80。显示模块80依照排序后的检查字词的顺序显示检查字词,以提供给使用者选择拼写检查后的结果,其中权重值较大的即为与使用者输入的英语字词相关程度较高的检查字词。 The sorting
接着,以一个实施例来说明本发明的运作方式及流程,并请参照图2、图3、图4A至图4E以及图5所示。 Next, an embodiment is used to illustrate the operation mode and process of the present invention, and please refer to FIG. 2 , FIG. 3 , FIG. 4A to FIG. 4E and FIG. 5 . the
图2是本发明拼写检查方法流程图;图3是本发明输入英语字词接口示意图;图4A至图4E是本发明拼写检查过程示意图;图5是本发明显示排序检查字词接口示意图。 Fig. 2 is a flow chart of the spelling checking method of the present invention; Fig. 3 is a schematic diagram of an interface for inputting English words of the present invention; Fig. 4A to Fig. 4E are schematic diagrams of the spelling checking process of the present invention; Fig. 5 is a schematic diagram of an interface for displaying and checking words in the present invention. the
如图3所示,用户在输入区域81中输入一个英语字词91为“reseatchavle”,输入模块10接收到用户输入的英语字词91“reseatchavle”(步骤100),并将英语字词91“reseatchavle”发送给字词查找模块20。 As shown in Figure 3, the user inputs an
字词查找模块20接收到英语字词91“reseatchavle”,由于英语字词91“reseatchavle”具有12个英文字母,因此,字词查找模块20会依据英语字词91“reseatchavle”的字母个数“12”,自检查字库21中取出与英语字词91“reseatchavle”的字母个数“12”相同的第一检查字词92为“researchable”、第二检查字词93为“unsearchable”以及第三检查字词94为“reproachable”(步骤200)。 The
请参考图4A所示,接着,字词查找模块20会将英语字词91“reseatchavle”、第一检查字词92“researchable”、第二检查字词93“unsearchable”以及第三检查字词94“reproachable”发送给字母对比模块30。 Please refer to shown in Fig. 4A, then,
字母对比模块30在接收到英语字词91“reseatchavle”、第一检查字词92“researchable”、第二检查字词93“unsearchable”以及第三检查字词94“reproachable”后,可以将英语字词91同时与第一检查字词92、第二检查字词93以及第三检查字词94进行对比,或是先对比英语字词91与第一检查字词92,再依序对比英语字词91与第二检查字词93、英语字词91与第三检查字词94。 After the
以实施例而言,采用同时对比的方法对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94,因此字母对比模块30首先会分别对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94的第一个英文字母,分别为“r”、“r”、“u”以及“r”,对比结果为第一检查字词92以及第三检查字词94的第一个英文字母与英语字词91的第一个英文字母相同,第二检查字词与英语字词91的第一个英文字母不相同。 In the embodiment, the
对于对比相同的第一检查字词92以及第三检查字词94,则会分别累计与第一检查字词92以及第三检查字词94相对应的第一权重值95以及第三权重值97,第一权重值95以及第三权重值97分别累计“0.5”的权重值,而第二检查字词93与英语字词91的第一个英文字母不相同,则与第二检查字词93相对应的第二权重值96不进行累计。 For comparing the same
接着,再次依照顺序分别对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94每一个位置的英文字母,每一个位置对比相同的英文字母则累计“0.5”的权重值,对比不相同的英文字母则不累计权重值,结果如图4A所示,第一检查字词92“researchable”对比的结果具有10个位置的英文字母与英语字词91“reseatchavle”相同,则会累计第一权重值95为“5”;第二检查字词93“unsearchable”对比的结果具有8个位置的英文字母与英语字词91“reseatchavle”相同,则会累计第二权重值96为“4”;第三检查字词94“reproachable”对比的结果具有7个位置的英文字母与英语字词91“reseatchavle”相同,则会累计第三权重值97为“3.5”(步骤300)。 Then, compare the English letters in each position of the
请参照图4B所示,接着,字母对比模块30会将英语字词91“reseatchavle”、第一检查字词92“researchable”、第二检查字词93“unsearchable”、第三检查字词94“reproachable”、第一权重值95“5”、第二权重值96“4”、第三权重值97“3.5”发送给字母关联模块40。 Please refer to FIG. 4B , and then, the
字母关联模块40依然采用同时对比的方法对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94,首先,字母关联模块40会通过字母对比模块30得知英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94中,英文字母不相同的相对应位置,第一检查字词92“researchable”在“6”、“10”两个位置的英文字母与英语字词91“reseatchavle” 不同;第二检查字词93“unsearchable”在“1”、“2”、“6”、“10”四个位置的英文字母与英语字词91“reseatchavle”不同;第三检查字词94“reproachable”在“3”、“4”、“5”、“6”、“10”五个位置的英文字母与英语字词91“reseatchavle”不同。
接着,第一检查字词92“researchable”在“6”、“10”两个位置的英文字母分别为“r”以及“b”,英语字词91“reseatchavle”在“6”、“10”两个位置的英文字母分别为“t”以及“v”,由于英文字母“t”操作上的关联英文字母为“g”、“r”以及“y”,以及英文字母“v”操作上的关联英文字母为“f”、“c”以及“b”,因此,“r”以及“b”分别与“t”以及“v”具有操作上的关联,字母关联模块40则会分别累计“0.01”的权重值,第一权重值95则累计为“5.02”。 Next, the English letters of the
第二检查字词93“unsearchable”在“1”、“2”、“6”、“10”四个位置的英文字母与英语字词91“reseatchavle”在“1”、“2”、“6”、“10”四个位置的英文字母不同,判断结果为两个位置的英文字母具有操作上的关联,字母关联模块40则会分别累计“0.01”的权重值,第二权重值96则会累计为“4.02”;第三检查字词94“reproachable”在“3”、“4”、“5”、“6”、“10”五个位置的英文字母与英语字词91“reseatchavle”在“3”、“4”、“5”、“6”、“10”五个位置的英文字母不同,判断结果为两个位置的英文字母具有操作上的关联,字母关联模块40则会分别累计“0.01”的权重值,第二权重值96则累计为“3.52”(步骤400)。 The
请参照图4C所示,接着,字母关联模块40会将英语字词91“reseatchavle”、第一检查字词92“researchable”、第二检查字词93“unsearchable”、第三检查字词94“reproachable”、第一权重值95“5.02”、第二权重值96“4.02”、第三权重值97“3.52”发送给相邻字母对比模块50。 Please refer to FIG. 4C, and then, the
相邻字母对比模块50依然采用同时对比的方法对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94,首先,相邻字母对比模块50会分别对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94的第一以及第二个英文字母分别为“re”、“re”、“un”以及“re”,对比结果为第一检查字词92以及第三检查字词94的第一以及第 二个英文字母与英语字词91的第一及第二个英文字母相同,第二检查字词与英语字词91的第一以及第二个英文字母不相同。 Adjacent letter comparison module 50 still adopts the method of comparing simultaneously to compare
对于对比相同的第一检查字词92以及第三检查字词94,则会分别累计与第一检查字词92以及第三检查字词94相对应的第一权重值95以及第三权重值97,第一权重值95以及第三权重值97分别累计“0.5”的权重值,而第二检查字词与英语字词91的第一个英文字母不相同,则与第二检查字词93相对应的第二权重值96不进行累计。 For comparing the same
接着,再次依照顺序分别对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94每两个相邻位置(例如:第一及第二位置、第二及第三位置...等)的英文字母,每两个相邻位置对比相同的英文字母则累计“0.5”的权重值,对比不相同的英文字母则不累计权重值,结果如图4C所示,第一检查字词92“researchable”对比的结果具有7个相邻位置的英文字母与英语字词91“reseatchavle”相同,则会累计第一权重值95为“8.52”;第二检查字词93“unsearchable”对比的结果具有5个相邻位置的英文字母与英语字词91“reseatchavle”相同,则会累计第二权重值96为“6.52”;第三检查字词94“reproachable”对比的结果具有4个相邻位置的英文字母与英语字词91“reseatchavle”相同,则会累计第三权重值97为“5.52”(步骤500)。 Then, compare the
请参照图4D所示,接着,相邻字母对比模块50会将英语字词91“reseatchavle”、第一检查字词92“researchable”、第二检查字词93“unsearchable”、第三检查字词94“reproachable”、第一权重值95“8.52”、第二权重值96“6.52”、第三权重值97“5.52”发送给首字母对比模块60。 Please refer to shown in Fig. 4D, then, the adjacent letter comparison module 50 will be the
首字母对比模块60依然采用同时对比的方法对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94,首先,首字母对比模块60会分别对比英语字词91、第一检查字词92、第二检查字词93以及第三检查字词94的首个英文字母分别为“r”、“r”、“u”以及“r”,对比结果为第一检查字词92以及第三检查字词94的第一个英文字母与英语字词91的第一个英文字母相同,第二检查字词与英语字词91的第一个英文字母不相同。 The initial
对于对比相同的第一检查字词92以及第三检查字词94,则会分别累计 与第一检查字词92以及第三检查字词94相对应的第一权重值95以及第三权重值97,第一权重值95以及第三权重值97分别累计“0.6”的权重值,而第二检查字词与英语字词91的第一个英文字母不相同,则与第二检查字词93相对应的第二权重值96不进行累计,结果如图4E所示,第一检查字词92“researchable”对比的结果与英语字词91“reseatchavle”首字母相同,则会累计第一权重值95为“9.12”;第二检查字词93“unsearchable”对比的结果与英语字词91“reseatchavle”首字母不相同,则第二权重值96为“6.52”;第三检查字词94“reproachable”对比的结果与英语字词91“reseatchavle”首字母相同,则会累计第三权重值97为“6.12”(步骤600)。 For comparing the same
经过字母对比模块30、字母关联模块40、相邻字母对比模块50以及首字母对比模块60所分别累计的第一权重值95“9.12”、第二权重值96“6.52”以及第三权重值97“6.12”累计完成后,接着,会将第一检查字词92“researchable”、第二检查字词93“unsearchable”、第三检查字词94“reproachable”、第一权重值95“9.12”、第二权重值96“6.52”、第三权重值97“6.12”发送给排序模块70。 The
排序模块70依据第一权重值95“9.12”、第二权重值96“6.52”、第三权重值97“6.12”进行第一检查字词92“researchable”、第二检查字词93“unsearchable”、第三检查字词94“reproachable”的排序,结果为与第一权重值95“9.12”相对应的第一检查字词92“researchable”优先排列,接着,与第二权重值96“6.52”相对应的第二检查字词93“unsearchable”排列第二,最后,与第三权重值97“6.12”相对应的第三检查字词94“reproachable”排列为最后,并将排序后的第一检查字词92“researchable”、第二检查字词93“unsearchable”、第三检查字词94“reproachable”发送给显示模块80(步骤700)。 The sorting
显示模块80依照排序后的第一检查字词92“researchable”、第二检查字词93“unsearchable”、第三检查字词94“reproachable”的顺序将各检查字词显示于显示区域82(步骤800)中,结果如图5所示,以提供使用者选择拼写检查后的结果,其中权重值较大的即为与使用者输入的英语字词相关程度较高的检查字词。 The
综上所述,可知本发明与现有技术之间的差异在于本发明通过对比英语字词以及检查字词的字母、相邻字母以及首字母是否相同,并且判断英语字词以及检查字词不相同的字母操作上的关联性,进行权重值累计,依照权重值的大小顺序对检查字词重新排序,权重值较高的检查字词即为较适合的拼写检查结果,从而可以将较合适的拼写检查结果优先显示给用户。 In summary, it can be seen that the difference between the present invention and the prior art is that the present invention compares English words and checks whether the letters, adjacent letters, and initial letters of the words are the same, and judges whether the English words and checking words are different. The relevance of the operation on the same letter, the weight value is accumulated, and the check words are reordered according to the order of the weight value. The check word with a higher weight value is the more suitable spelling check result, so that the more suitable Spell check results are shown to the user first. the
虽然本发明所提出的实施方式如上,但是所述的内容并非用来直接限定本发明的专利保护范围。任何本发明所属技术领域中具有通常技术知识的人员,在不脱离本发明所提出的精神和范围的前提下,可以在实施的形式上及细节上作一些更改。本发明的专利保护范围,仍须以所附的权利要求书范围所界定为准。 Although the embodiments of the present invention are as above, the content described is not used to directly limit the patent protection scope of the present invention. Anyone with ordinary technical knowledge in the technical field to which the present invention belongs can make some changes in the form and details of the implementation without departing from the spirit and scope of the present invention. The scope of patent protection of the present invention must still be defined by the scope of the appended claims. the
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101323264A CN101625678B (en) | 2008-07-11 | 2008-07-11 | Spell checking system and method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101323264A CN101625678B (en) | 2008-07-11 | 2008-07-11 | Spell checking system and method thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101625678A CN101625678A (en) | 2010-01-13 |
CN101625678B true CN101625678B (en) | 2011-01-19 |
Family
ID=41521529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008101323264A Expired - Fee Related CN101625678B (en) | 2008-07-11 | 2008-07-11 | Spell checking system and method thereof |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101625678B (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8386926B1 (en) * | 2011-10-06 | 2013-02-26 | Google Inc. | Network-based custom dictionary, auto-correction and text entry preferences |
CN102542000A (en) * | 2011-12-07 | 2012-07-04 | 北京风灵创景科技有限公司 | Method and equipment for retrieving contacts |
CN104102625B (en) * | 2013-04-15 | 2017-07-04 | 佳能株式会社 | The method and apparatus that spell check is improved by application keyboard layout information |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1244680A (en) * | 1998-08-12 | 2000-02-16 | 英业达股份有限公司 | Spell checking method using pronunciation and wildcard characters |
CN1670723A (en) * | 2004-03-16 | 2005-09-21 | 微软公司 | Systems and methods for improved spell checking |
-
2008
- 2008-07-11 CN CN2008101323264A patent/CN101625678B/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1244680A (en) * | 1998-08-12 | 2000-02-16 | 英业达股份有限公司 | Spell checking method using pronunciation and wildcard characters |
CN1670723A (en) * | 2004-03-16 | 2005-09-21 | 微软公司 | Systems and methods for improved spell checking |
Also Published As
Publication number | Publication date |
---|---|
CN101625678A (en) | 2010-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7003725B2 (en) | Method and system for normalizing dirty text in a document | |
CN103299550B (en) | For having the spell check of the keyboard system of automatic calibration | |
CN104731976B (en) | The discovery of private data and sorting technique in tables of data | |
JP3041268B2 (en) | Chinese Error Checking (CEC) System | |
US7809695B2 (en) | Information retrieval systems with duplicate document detection and presentation functions | |
US8539349B1 (en) | Methods and systems for splitting a chinese character sequence into word segments | |
US10152139B2 (en) | Autocompletion method and system | |
CN101256462A (en) | Handwriting input method and device based on full hybrid associative library | |
US20080235003A1 (en) | Disambiguation of telephone style key presses to yield chinese text using segmentation and selective shifting | |
TW200842613A (en) | Spell-check for a keyboard system with automatic correction | |
US20050192944A1 (en) | A method and apparatus for searching large databases via limited query symbol sets | |
CN101876878A (en) | Word prediction input system and method | |
US20120323905A1 (en) | Ranking data utilizing attributes associated with semantic sub-keys | |
US9298276B1 (en) | Word prediction for numbers and symbols | |
JP2017194727A (en) | Causal relation extraction device, causal relation extraction method and causal relation extraction program | |
JP4631795B2 (en) | Information search support system, information search support method, and information search support program | |
CN104281275B (en) | The input method of a kind of English and device | |
CN101888427A (en) | Method for matching dialing name and terminal | |
CN101625678B (en) | Spell checking system and method thereof | |
US20120323904A1 (en) | Automatic generation of a search query | |
CN102419639A (en) | Input system and method for providing expanded words | |
CN113051919B (en) | Method and device for identifying named entity | |
US20120317103A1 (en) | Ranking data utilizing multiple semantic keys in a search query | |
JP2011103059A (en) | Technical term extraction device and program | |
CN105893614A (en) | Information recommendation method and device and electronic equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110119 Termination date: 20170711 |