CN1152293C - 一种汉字输入法 - Google Patents
一种汉字输入法 Download PDFInfo
- Publication number
- CN1152293C CN1152293C CNB991256085A CN99125608A CN1152293C CN 1152293 C CN1152293 C CN 1152293C CN B991256085 A CNB991256085 A CN B991256085A CN 99125608 A CN99125608 A CN 99125608A CN 1152293 C CN1152293 C CN 1152293C
- Authority
- CN
- China
- Prior art keywords
- character
- chinese
- chinese character
- stroke
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 230000008676 import Effects 0.000 claims description 12
- 150000001875 compounds Chemical class 0.000 claims description 11
- 229910052757 nitrogen Inorganic materials 0.000 claims description 2
- 229910052698 phosphorus Inorganic materials 0.000 claims description 2
- 230000000630 rising effect Effects 0.000 claims description 2
- 230000014509 gene expression Effects 0.000 abstract 1
- 244000287680 Garcinia dulcis Species 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明是采用“札”字五笔画,以及26个英文小写字母作为汉字输入(书写码元)的图形元件,通过计算机对上述笔画和字母的图形进行联机书写识别,按规则——转换生成——调用对应的汉字内码,从而实现汉字“海量词语”准确、高效地输入计算机的一种方法。
Description
本发明是利用“札”的5个基本笔划对应汉字双笔形和计算机键盘区位的数字编码,以汉字的基本笔划及26个英文小写字母作为手写图形识别的系统元件;按照一定规则通过向计算机写入简单的笔画和字母图形(书写码元),经计算机对少量简单字符图形的识别转换,形成类似汉字键盘输入的编码和算法,从汉字编码字、词典中对应算出汉字内码的一种汉字输入方法。
一、一种汉字输入法,包括:“札”字的五个笔画、汉字声母、韵母及声调、二十六个小写字母与键位数码、英文大写字母的对应关系。
(1)汉字“札”字的五个笔画:横=一=1,竖=丨=2,撇=丿=3,点=丶=4,折=乙=5。
(2)汉字声母与英文大写字母的对应关系:
b=B,c=C,ch=C,d=D,f=F,g=G,h=H,j=J,k=K,l=L,m=M,n=N,p=P,q=Q,r=R,s=S,sh=S,t=T,w=W,x=X,y=Y,z=Z,zh=Z
韵母独立成音节时:a、ai、an、ang、ao的“零声母”为A;er、en、eng的“零声母”为E;ou的“零声母”为O.
(3)汉字韵母与英文大写字母的对应关系:
a=A,ia=B,ua=B,uan=C,ao=D,e=E,an=F,ang=G,iang=H,uang=H,i=I,ian=J,iao=K,in=L,ing=L,ie=M,iu=N,o=O,uo=O,ou=P,er=Q,en=R,ai=S,eng=T,u=U,u=U,ui=V,ue=V,ei=W,uai=X,ong=Y,iong=Y,un=Z
(4)汉字声调与英文大写字母的对应关系:
阴平=11=G,阳平=22=J,上声=33=E,去声=44=O
(5)小写字母图形、双笔图形与英文大写字母的对应关系:g=一一=11=G,f=一丨=12=F,d=一丿=13=D,s=一丶=14=S,a=一乙=15=A,h=丨一=21=H,j=丨丨=22=J,k=丨丿23=K,l=丨丶=24=L,m=丨乙=25=M,t=丿一31=T,r=丿丨=32=R,e=丿丿=33=E,w=丿丶=34=W,q=丿乙=35=Q,y=丶一=41=Y,u=丶丨=42=U,i=丶丿=43=I,o=丶丶=44=O,p=丶乙=45=P,n=乙一=51=N,b=乙丨=52=B,v=乙丿=53=V,C=乙丶=54=C,x=乙乙=55=X,Z=66=Z。
二、编码元件与计算机键盘的关系表
三、输入原理(附图解释):
①特定书写图形(笔画和英文小写字母)字符的写入——②计算机对输入图形作对比分析——转换——③半角数字编码——转换生成——④对应(半角大写英文字母)键位的编码——⑤检索汉字编码字、词典——⑥对应算出汉字的内码或内码串——⑦字形地址码或地址码串——⑧字形点阵码或点阵码串——⑨显示输出。
四、输入规则
(一)、“字符图形”的编码和输入方式
(1)、单字的编码和输入式
写入汉字首双笔图形+汉字的尾双笔图形
+汉字声母字符+汉字韵母的代码字符
+汉字声调的代码字符。输入步骤:
例如,输入“编”字 注:(编码字词典XJBJG#编)
第一步,写入“编”字的首双笔图形“乙乙”
第二步,写入“编”字的尾双笔图形“丨丨”
第三步,写入“编”字的声母字符“b”
第四步,写入“编”字的韵母代码字符“j”
第五步,写入“编”字的的声调代码字符“g”
| 联机手写板 | |||||
| 乙乙 | 丨丨 | b | 77 | ||
| (方格的划分只是为了便于书写) | |||||
视屏提示行:
| 手写输入 XJ.... 1:编BJ 2:骗PJ 3:驯XZ |
视屏提示行:
| 手写输入 XJB... 1:编JG |
注:77=空格,确定输入并返回到待输入的状态(下同)。
又如,输入“码”字(编码字词典DNMAE#码)
第一步,写入“码”字的首双笔图形“一丿”
第二步,写入“码”字的尾双笔图形“乙一”
第三步,写入“码”字的声母字符“m”
第四步,写入“码”字的韵母代码字符“a”
第五步,写入“码”字的的声调代码字符“e”
| 联机手写板 | |||||
| 一丿 | 乙一 | m | 77 | ||
视屏提示行:
| 手写输入DNM... 1:码AE |
(2)、二字词的编码和输入式
写入第一个汉字的首双笔图形+第一个汉字的尾双笔图形+第二个汉字的首双笔图形+第二个汉字的尾双笔图形+第一个汉字的声母字符+第二个汉字的声母字符。
输入步骤:
例如,输入“汉字”(编码字词典OCOHHZ编)
第一步,写入“汉”字的首双笔图形“丶丶”
第二步,写入“汉”字的尾双笔图形“乙丶”
第三步,写入“字”字的首双笔图形“丶丶”
第四步,写入“字”字的尾双笔图形“丨一”
第五步,写入“汉”字的声母字符“h”
第六步,写入“字”字的声母字符“z”
| 联机手写板 | |||||
| 丶丶 | 乙丶 | 丶丶 | 丨一 | 77 | |
视屏提示行:
| 手写输入OCOH.. 1:汉字HZ |
(3)、三字词的编码和输入式
写入第一个汉字的首双笔图形+第二个汉字的首双笔图形+第三个汉字的首双笔图形+第一个汉字的声母字符+第二个汉字的声母字符+第三个汉字的声母字符。
输入步骤:
例如,输入“计算机”(编码字词典PTFJSJ计算机)
第一步,写入“计”字的首双笔图形“丶乙”
第二步,写入“算”字的首双笔图形“丿一”
第三步,写入“机”字的首双笔图形“一丨”
第四步,写入“计”字的声母字符“j”
第五步,写入“算”字的声母字符“s”
第六步,写入“机”字的声母字符“j”
| 联机手写板 |
| 丶乙 | 丿一 | 一丨 | 77 | ||
视屏提示行:
| 手写输入PTF... 1:计算机JSJ |
(4)、四字词的编码和输入式
写入第一个汉字的首双笔图形+第二个汉字的首双笔图形+第三个汉字的首双笔图形+第四个汉字的首双笔图形+第一个汉字的声母字符+第四个汉字的声母字符。
输入步骤:
例如,输入“科学技术”(编码字词典TOFFKS科学技术)
第一步,写入“科”字的首双笔图形“丿一”
第二步,写入“学”字的首双笔图形“丶丶”
第三步,写入“技”字的首双笔图形“一丨”
第四步,写入“术”字的首双笔图形“一丨”
第五步,写入“科”字的声母字符“k”
第六步,写入“术”字的声母字符“s”
| 联机手写板 | |||||
| 丿一 | 丶丶 | 一丨 | 一丨 | 77 | |
视屏提示行:
| 手写输入TOFF.. 1:科学技术KS |
(5)、句子的编码和输入式
写入第一个汉字的首双笔图形+第二个汉字的首双笔图形+第三个汉字的首双笔图形+末尾汉字的首双笔图形+第一个汉字的声母字符+末尾汉字的声母字符。
输入步骤:
例如,输入“中国专利局”(编码字词典MMGNZJ中国专利局)
第一步,写入“中”字的首双笔图形“丨乙”
第二步,写入“国”字的首双笔图形“丨乙”
第三步,写入“专”字的首双笔图形“一一”
第四步,写入“局”字的首双笔图形“乙一”
第五步,写入“中”字的声母字符“z”
第六步,写入“局”字的声母字符“j”
| 联机手写板 | |||||
| 丨乙 | 丨乙 | 一一 | 乙一 | 77 | |
视屏提示行:
| 手写输入MMGN 1:中国专利局ZJ |
五、关于汉字手写输入的讨论
汉字的基本笔画有五种:横一,竖丨,撇丿,点丶,折乙。汉字的笔画数最少的是一笔(一和乙),简体字笔画数最多的有三十八笔(鼻+囊)。据统计,简化汉字的平均笔画数为十二笔左右,三千个常用字的平均笔画数为八笔。
手写字形识别输入技术因受汉字字数多、字体种类差异、大小不均、个人笔迹的不同。。。等等错综复杂的条件限制,使其识别速度和正确识别率受到制约,从而影响了它的实用价值。另外,输入一个汉字要书写八至十二个笔画,亦影响了汉字手写体输入的速度。
本发明所提供的”书写码元”识别输入方法,输入一个汉字只要书写三至四个笔画;更为重要的作用还在于:用5个汉字的基本笔画和26个小写字母作为识别元件,极大地简化了对数以万计且错综复杂的手写字体识别过程,有效地提高了汉字手写输入的正确识别率和识别速度。我们对这种识别方法正确识别率的企望值为99.9%,识别输入速度的企望值为100-120字/分;比现有技术25字/分,快3-5倍。
下面,我们对上述输入法的特点作一些粗浅探讨。
(一)、易学性的优势
1、无师自通,不需培训;适应面广,老少皆宜。
2、简化识别,正确率高;高频先见,界面友好。
3、字词简写,事半功倍;六位编码,容量极大。
(二)、字词库的结构特点和大容量的编码空间1、字词库的结构特点
(1)、一、二级简码字库(据统计有25+480个汉字)可独立编码,启动时调入内存,以减少读盘。
(2)、字库和词库可复合编码,统一使用六位码长;内码串不限长度,以空格为终止符,以便于查算。
(3)、字词库以前二码分组排序和调用,则可分成625组调用。
字词库扫描检索表结构(?号为磁盘扇区起止地址信息):
AA???? AB???? AC????......AZ????
BA???? BB???? BC????......BZ????
CA???? CB???? CC????......CZ????
......
YA???? YB???? YC????......YZ????
字词库结构(#号为可填充的汉字编码信息):
AA####汉字内码 AA####汉字内码串 ...
AB####汉字内码 AB####汉字内码串 ...
AC####汉字内码 AC####汉字内码串 ...
......
BA####汉字内码 BA####汉字内码串 ...
BB####汉字内码 BB####汉字内码串 ...
BC####汉字内码 BC####汉字内码串 ...
......
YY####汉字内码 YYYYFD疯疯癫癫
优点是:第一,便于分组调用大容量的字词库;
第二,按AA、AB、AC......分组调整字词频度,
三级简码可自动实现;
第三,只需开设8至16KB的内存空间,便可分
组调用10到20万条词汇。
2、字词库的大容量空间
(1)、根据单字的编码方式:
汉字首双笔图形的代码+汉字尾双笔图形的代码
+汉字声母字符+汉字韵母的代码+汉字声调的代码。
可以计算出单字的编码容量为:
(25*25)*(23*26*4)
=625*2392
=149万个(信息空间)
(2)、根据二字词的编码方式:
第一个汉字首双笔图形的代码+第一个汉字尾双笔图形的代码+第二个汉字首双笔图形的代码+第二个汉字尾双笔图形的代码+第一个汉字的声母字符+第二个汉字的声母字符。
可以计算双字词的实际编码容量约为:
(480*480)*(23*23)
=230400*529
=1.2亿多个(信息空间)
(3)、根据三字词的编码方式:
第一个汉字首双笔图形的代码++第二个汉字首双笔图形的代码+第三个汉字首双笔图形的代码+第一个汉字的声母字符+第二个汉字的声母字符+第三个汉字的声母字符。
可以计算出三字词的编码容量约为:
25*25*25*23*23*23
=15625*12167
=1.9亿个(信息空间)
(4)、根据四字词的编码方式:
第一个汉字首双笔图形的代码+第二个汉字首双笔图形的代码+第三个汉字首双笔图形的代码+第四个汉字首双笔图形的代码+第一个汉字的声母字符+第四个汉字的声母字符。
可以计算出四字词的编码容量约为:
25*25*25*25*23*23
=390625*529
=2亿个(信息空间)
近二十多年来,计算机中文信息处理技术从无到有,随着计算机技术日新月异的进步而不断发展,果实累累。这是专家学者、工程技术人员和相关项目设计者(发明人)共同努力的结果,展示了我国普及计算机教育和应用的广阔前景。
由于本人学识浅薄,上述汉字输入方法的缺陷乃至错误,或恐难免;因此,希望能够得到中专局专家和专利文献读者的教正!
Claims (4)
1、一种汉字输入法,包括:
(1)“札”字的五个笔画、汉字声母、韵母及声调、二十六个小写字母与键位数码、英文大写字母的对应关系
汉字“札”字的五个笔画:横=一=1,竖=丨=2,撇=丿=3,点=丶=4,折=乙=5。
汉字声母与英文大写字母的对应关系:
b=B,c=C,ch=C,d=D,f=F,g=G,h=H,j=J,k=K,l=L,m=M,n=N,p=P,q=Q,r=R,s=S,sh=S,t=T,w=W,x=X,y=Y,z=Z,zh=Z
韵母独立成音节时:a、ai、an、ang、ao的“零声母”为A;er、en、eng的“零声母”为E;ou的“零声母”为O.
汉字韵母与英文大写字母的对应关系:
a=A,ia=B,ua=B,uan=C,ao=D,e=E,an=F,ang=G,iang=H,uang=H,i=I,ian=J,iao=K,in=L,ing=L,ie=M,iu=N,o=O,uo=O,ou=P,er=Q,en=R,ai=S,eng=T,u=U,u=U,ui=V,ue=V,ei=W,uai=X,ong=Y,iong=Y,un=Z
汉字声调与英文大写字母的对应关系:阴平=11=G,阳平=22=J,上声=33=E,去声=44=0
小写字母图形、双笔图形与英文大写字母的对应关系:
g=一一=11=G,f=一丨=12=F,d=一丿=13=D,s=一丶=14=S,a=一乙=15=A,h=丨一=21=H,j=丨丨=22=J,k=丨丿23=K,l=丨丶=24=L,m=丨乙=25=M,t=丿一31=T,r=丿丨=32=R,e=丿丿=33=E,w=丿丶=34=w,q=丿乙=35=Q,y=丶一=41=Y,u=丶丨=42=U,i=丶丿=43=I,o=丶丶=44=O,p=丶乙=45=P,n=乙一=51=N,b=乙丨=52=B,v=乙丿=53=V,C=乙丶=54=C,x=乙乙=55=X,z=66=Z。
(2)输入步骤。
第一步,按汉字笔画顺序输入汉字的第一笔和第二笔;
第二步,按汉字笔画顺序输入汉字的最后二笔;
第三步,输入汉字的声母字符;
第四步,输入汉字的韵母代码字符;
第五步,输入汉字的声调代码字符。
2、根据权利要求1的输入法,其特征还在于二字词输入方法为
第一步,按汉字笔画顺序输入第一个汉字的第一笔和第二笔;
第二步,按汉字笔画顺序输入第一个汉字的最后二笔;
第三步,按汉字笔画顺序输入第二个汉字的第一笔和第二笔;
第四步,按汉字笔画顺序输入第二个汉字的最后二笔;
第五步,输入第一个汉字的声母字符;
第六步,输入第二个汉字的声母字符。
3、根据权利要求1的输入法,其特征还在于三字词输入方法
第一步,按汉字笔画顺序输入第一个汉字的第一笔和第二笔;
第二步,按汉字笔画顺序输入第二个汉字的第一笔和第二笔;
第三步,按汉字笔画顺序输入第三个汉字的第一笔和第二笔;
第四步,输入第一个汉字的声母字符;
第五步,输入第二个汉字的声母字符;
第六步,输入第三个汉字的声母字符。
4、根据权利要求1的输入法,其特征还在于四字词输入方法为
第一步,按汉字笔画顺序输入第一个汉字的第一笔和第二笔;
第二步,按汉字笔画顺序输入第二个汉字的第一笔和第二笔;
第三步,按汉字笔画顺序输入第三个汉字的第一笔和第二笔;
第四步,按汉字笔画顺序输入第四个汉字的第一笔和第二笔;
第五步,输入第一个汉字的声母字符;
第六步,输入第四个汉字的声母字符。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CNB991256085A CN1152293C (zh) | 1999-11-23 | 1999-11-23 | 一种汉字输入法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CNB991256085A CN1152293C (zh) | 1999-11-23 | 1999-11-23 | 一种汉字输入法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN1297187A CN1297187A (zh) | 2001-05-30 |
| CN1152293C true CN1152293C (zh) | 2004-06-02 |
Family
ID=5284033
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CNB991256085A Expired - Fee Related CN1152293C (zh) | 1999-11-23 | 1999-11-23 | 一种汉字输入法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN1152293C (zh) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103744535B (zh) * | 2014-01-10 | 2017-01-18 | 李正才 | 同音五笔输入法 |
-
1999
- 1999-11-23 CN CNB991256085A patent/CN1152293C/zh not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| CN1297187A (zh) | 2001-05-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN1026525C (zh) | 智能五笔双拼码计算机汉字输入方法 | |
| CN1023916C (zh) | 简繁五笔字根汉字输入系统 | |
| CN1095137C (zh) | 字典检索装置 | |
| CN1549192A (zh) | 手写字体的计算机识别与自动输入方法 | |
| CN101067766A (zh) | 输入法中取消字符串的方法及文字输入系统 | |
| CN1152293C (zh) | 一种汉字输入法 | |
| CN1136496C (zh) | 简化拼音-触摸屏鼠标式汉字输入方法 | |
| CN1916940A (zh) | 模板优化的字符识别方法和系统 | |
| CN101046706A (zh) | 用于不同人群电脑和手机可通用的输入法 | |
| CN1059281C (zh) | 汉字声韵调三拼音形编码输入方法 | |
| CN1121645C (zh) | 音形字理码汉字输入方法 | |
| CN1203389C (zh) | 计算机整句汉字起始四笔划输入方法 | |
| CN1347023A (zh) | 二笔手写智能输入系统 | |
| CN1257445C (zh) | 音义码汉字输入方法 | |
| CN1380620A (zh) | 图书索引自动编排方法 | |
| CN1104673C (zh) | 计算机汉字字根笔画分段输入方法 | |
| CN1150441C (zh) | 字形笔顺码汉字输入法及其键盘 | |
| CN1301453C (zh) | 一种汉字双拼输入法 | |
| CN1512308A (zh) | 字处理方法、装置及存储介质 | |
| CN101030106A (zh) | 声母韵母声标2-4码手机汉字输入法 | |
| CN1201220C (zh) | 核心码计算机输入法 | |
| CN1384424A (zh) | 计算机四角码汉字输入法及其键盘 | |
| CN1598743A (zh) | 按规范笔顺输入汉字的输入法及其键盘 | |
| CN1838044A (zh) | 中文拼音声调笔划组合输入法 | |
| CN1155115A (zh) | 键位中西文输入系统及其设备 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C14 | Grant of patent or utility model | ||
| GR01 | Patent grant | ||
| C57 | Notification of unclear or unknown address | ||
| DD01 | Delivery of document by public notice |
Addressee: Tang Jianmin Document name: payment instructions |
|
| C57 | Notification of unclear or unknown address | ||
| DD01 | Delivery of document by public notice |
Addressee: Tang Jianmin Document name: Resumption of claim approval decision |
|
| C57 | Notification of unclear or unknown address | ||
| DD01 | Delivery of document by public notice |
Addressee: Tang Jianmin Document name: Notification to Pay the Fees |
|
| C57 | Notification of unclear or unknown address | ||
| DD01 | Delivery of document by public notice |
Addressee: Tang Jianmin Document name: Notification of Termination of Patent Right |
|
| C19 | Lapse of patent right due to non-payment of the annual fee | ||
| CF01 | Termination of patent right due to non-payment of annual fee |