[go: up one dir, main page]

CN1152293C - 一种汉字输入法 - Google Patents

一种汉字输入法 Download PDF

Info

Publication number
CN1152293C
CN1152293C CNB991256085A CN99125608A CN1152293C CN 1152293 C CN1152293 C CN 1152293C CN B991256085 A CNB991256085 A CN B991256085A CN 99125608 A CN99125608 A CN 99125608A CN 1152293 C CN1152293 C CN 1152293C
Authority
CN
China
Prior art keywords
character
chinese
chinese character
stroke
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB991256085A
Other languages
English (en)
Other versions
CN1297187A (zh
Inventor
汤建民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNB991256085A priority Critical patent/CN1152293C/zh
Publication of CN1297187A publication Critical patent/CN1297187A/zh
Application granted granted Critical
Publication of CN1152293C publication Critical patent/CN1152293C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明是采用“札”字五笔画,以及26个英文小写字母作为汉字输入(书写码元)的图形元件,通过计算机对上述笔画和字母的图形进行联机书写识别,按规则——转换生成——调用对应的汉字内码,从而实现汉字“海量词语”准确、高效地输入计算机的一种方法。

Description

一种汉字输入法
本发明是利用“札”的5个基本笔划对应汉字双笔形和计算机键盘区位的数字编码,以汉字的基本笔划及26个英文小写字母作为手写图形识别的系统元件;按照一定规则通过向计算机写入简单的笔画和字母图形(书写码元),经计算机对少量简单字符图形的识别转换,形成类似汉字键盘输入的编码和算法,从汉字编码字、词典中对应算出汉字内码的一种汉字输入方法。
一、一种汉字输入法,包括:“札”字的五个笔画、汉字声母、韵母及声调、二十六个小写字母与键位数码、英文大写字母的对应关系。
(1)汉字“札”字的五个笔画:横=一=1,竖=丨=2,撇=丿=3,点=丶=4,折=乙=5。
(2)汉字声母与英文大写字母的对应关系:
b=B,c=C,ch=C,d=D,f=F,g=G,h=H,j=J,k=K,l=L,m=M,n=N,p=P,q=Q,r=R,s=S,sh=S,t=T,w=W,x=X,y=Y,z=Z,zh=Z
韵母独立成音节时:a、ai、an、ang、ao的“零声母”为A;er、en、eng的“零声母”为E;ou的“零声母”为O.
(3)汉字韵母与英文大写字母的对应关系:
a=A,ia=B,ua=B,uan=C,ao=D,e=E,an=F,ang=G,iang=H,uang=H,i=I,ian=J,iao=K,in=L,ing=L,ie=M,iu=N,o=O,uo=O,ou=P,er=Q,en=R,ai=S,eng=T,u=U,u=U,ui=V,ue=V,ei=W,uai=X,ong=Y,iong=Y,un=Z
(4)汉字声调与英文大写字母的对应关系:
阴平=11=G,阳平=22=J,上声=33=E,去声=44=O
(5)小写字母图形、双笔图形与英文大写字母的对应关系:g=一一=11=G,f=一丨=12=F,d=一丿=13=D,s=一丶=14=S,a=一乙=15=A,h=丨一=21=H,j=丨丨=22=J,k=丨丿23=K,l=丨丶=24=L,m=丨乙=25=M,t=丿一31=T,r=丿丨=32=R,e=丿丿=33=E,w=丿丶=34=W,q=丿乙=35=Q,y=丶一=41=Y,u=丶丨=42=U,i=丶丿=43=I,o=丶丶=44=O,p=丶乙=45=P,n=乙一=51=N,b=乙丨=52=B,v=乙丿=53=V,C=乙丶=54=C,x=乙乙=55=X,Z=66=Z。
二、编码元件与计算机键盘的关系表
Figure C9912560800061
三、输入原理(附图解释):
①特定书写图形(笔画和英文小写字母)字符的写入——②计算机对输入图形作对比分析——转换——③半角数字编码——转换生成——④对应(半角大写英文字母)键位的编码——⑤检索汉字编码字、词典——⑥对应算出汉字的内码或内码串——⑦字形地址码或地址码串——⑧字形点阵码或点阵码串——⑨显示输出。
四、输入规则
(一)、“字符图形”的编码和输入方式
(1)、单字的编码和输入式
写入汉字首双笔图形+汉字的尾双笔图形
+汉字声母字符+汉字韵母的代码字符
+汉字声调的代码字符。输入步骤:
例如,输入“编”字  注:(编码字词典XJBJG#编)
第一步,写入“编”字的首双笔图形“乙乙”
第二步,写入“编”字的尾双笔图形“丨丨”
第三步,写入“编”字的声母字符“b”
第四步,写入“编”字的韵母代码字符“j”
第五步,写入“编”字的的声调代码字符“g”
            联机手写板
乙乙 丨丨  b  77
    (方格的划分只是为了便于书写)
视屏提示行:
手写输入  XJ....  1:编BJ  2:骗PJ  3:驯XZ
视屏提示行:
手写输入  XJB...  1:编JG
注:77=空格,确定输入并返回到待输入的状态(下同)。
又如,输入“码”字(编码字词典DNMAE#码)
第一步,写入“码”字的首双笔图形“一丿”
第二步,写入“码”字的尾双笔图形“乙一”
第三步,写入“码”字的声母字符“m”
第四步,写入“码”字的韵母代码字符“a”
第五步,写入“码”字的的声调代码字符“e”
            联机手写板
一丿 乙一 m  77
视屏提示行:
手写输入DNM...  1:码AE
(2)、二字词的编码和输入式
写入第一个汉字的首双笔图形+第一个汉字的尾双笔图形+第二个汉字的首双笔图形+第二个汉字的尾双笔图形+第一个汉字的声母字符+第二个汉字的声母字符。
输入步骤:
例如,输入“汉字”(编码字词典OCOHHZ编)
第一步,写入“汉”字的首双笔图形“丶丶”
第二步,写入“汉”字的尾双笔图形“乙丶”
第三步,写入“字”字的首双笔图形“丶丶”
第四步,写入“字”字的尾双笔图形“丨一”
第五步,写入“汉”字的声母字符“h”
第六步,写入“字”字的声母字符“z”
                           联机手写板
    丶丶     乙丶     丶丶    丨一     77
视屏提示行:
手写输入OCOH..  1:汉字HZ
(3)、三字词的编码和输入式
写入第一个汉字的首双笔图形+第二个汉字的首双笔图形+第三个汉字的首双笔图形+第一个汉字的声母字符+第二个汉字的声母字符+第三个汉字的声母字符。
输入步骤:
例如,输入“计算机”(编码字词典PTFJSJ计算机)
第一步,写入“计”字的首双笔图形“丶乙”
第二步,写入“算”字的首双笔图形“丿一”
第三步,写入“机”字的首双笔图形“一丨”
第四步,写入“计”字的声母字符“j”
第五步,写入“算”字的声母字符“s”
第六步,写入“机”字的声母字符“j”
        联机手写板
丶乙 丿一  一丨   77
视屏提示行:
手写输入PTF...  1:计算机JSJ
(4)、四字词的编码和输入式
写入第一个汉字的首双笔图形+第二个汉字的首双笔图形+第三个汉字的首双笔图形+第四个汉字的首双笔图形+第一个汉字的声母字符+第四个汉字的声母字符。
输入步骤:
例如,输入“科学技术”(编码字词典TOFFKS科学技术)
第一步,写入“科”字的首双笔图形“丿一”
第二步,写入“学”字的首双笔图形“丶丶”
第三步,写入“技”字的首双笔图形“一丨”
第四步,写入“术”字的首双笔图形“一丨”
第五步,写入“科”字的声母字符“k”
第六步,写入“术”字的声母字符“s”
               联机手写板
丿一  丶丶  一丨  一丨   77
视屏提示行:
手写输入TOFF..  1:科学技术KS
(5)、句子的编码和输入式
写入第一个汉字的首双笔图形+第二个汉字的首双笔图形+第三个汉字的首双笔图形+末尾汉字的首双笔图形+第一个汉字的声母字符+末尾汉字的声母字符。
输入步骤:
例如,输入“中国专利局”(编码字词典MMGNZJ中国专利局)
第一步,写入“中”字的首双笔图形“丨乙”
第二步,写入“国”字的首双笔图形“丨乙”
第三步,写入“专”字的首双笔图形“一一”
第四步,写入“局”字的首双笔图形“乙一”
第五步,写入“中”字的声母字符“z”
第六步,写入“局”字的声母字符“j”
               联机手写板
 丨乙  丨乙 一一  乙一   77
视屏提示行:
手写输入MMGN  1:中国专利局ZJ
五、关于汉字手写输入的讨论
汉字的基本笔画有五种:横一,竖丨,撇丿,点丶,折乙。汉字的笔画数最少的是一笔(一和乙),简体字笔画数最多的有三十八笔(鼻+囊)。据统计,简化汉字的平均笔画数为十二笔左右,三千个常用字的平均笔画数为八笔。
手写字形识别输入技术因受汉字字数多、字体种类差异、大小不均、个人笔迹的不同。。。等等错综复杂的条件限制,使其识别速度和正确识别率受到制约,从而影响了它的实用价值。另外,输入一个汉字要书写八至十二个笔画,亦影响了汉字手写体输入的速度。
本发明所提供的”书写码元”识别输入方法,输入一个汉字只要书写三至四个笔画;更为重要的作用还在于:用5个汉字的基本笔画和26个小写字母作为识别元件,极大地简化了对数以万计且错综复杂的手写字体识别过程,有效地提高了汉字手写输入的正确识别率和识别速度。我们对这种识别方法正确识别率的企望值为99.9%,识别输入速度的企望值为100-120字/分;比现有技术25字/分,快3-5倍。
下面,我们对上述输入法的特点作一些粗浅探讨。
(一)、易学性的优势
1、无师自通,不需培训;适应面广,老少皆宜。
2、简化识别,正确率高;高频先见,界面友好。
3、字词简写,事半功倍;六位编码,容量极大。
(二)、字词库的结构特点和大容量的编码空间1、字词库的结构特点
(1)、一、二级简码字库(据统计有25+480个汉字)可独立编码,启动时调入内存,以减少读盘。
(2)、字库和词库可复合编码,统一使用六位码长;内码串不限长度,以空格为终止符,以便于查算。
(3)、字词库以前二码分组排序和调用,则可分成625组调用。
字词库扫描检索表结构(?号为磁盘扇区起止地址信息):
AA????  AB????  AC????......AZ????
BA????  BB????  BC????......BZ????
CA????  CB????  CC????......CZ????
......
YA????  YB????  YC????......YZ????
字词库结构(#号为可填充的汉字编码信息):
AA####汉字内码      AA####汉字内码串  ...
AB####汉字内码      AB####汉字内码串  ...
AC####汉字内码      AC####汉字内码串  ...
......
BA####汉字内码      BA####汉字内码串  ...
BB####汉字内码      BB####汉字内码串  ...
BC####汉字内码      BC####汉字内码串  ...
                ......
                YY####汉字内码       YYYYFD疯疯癫癫
        优点是:第一,便于分组调用大容量的字词库;
                第二,按AA、AB、AC......分组调整字词频度,
                      三级简码可自动实现;
        第三,只需开设8至16KB的内存空间,便可分
              组调用10到20万条词汇。
2、字词库的大容量空间
(1)、根据单字的编码方式:
汉字首双笔图形的代码+汉字尾双笔图形的代码
+汉字声母字符+汉字韵母的代码+汉字声调的代码。
可以计算出单字的编码容量为:
    (25*25)*(23*26*4)
    =625*2392
    =149万个(信息空间)
(2)、根据二字词的编码方式:
第一个汉字首双笔图形的代码+第一个汉字尾双笔图形的代码+第二个汉字首双笔图形的代码+第二个汉字尾双笔图形的代码+第一个汉字的声母字符+第二个汉字的声母字符。
可以计算双字词的实际编码容量约为:
(480*480)*(23*23)
=230400*529
=1.2亿多个(信息空间)
(3)、根据三字词的编码方式:
第一个汉字首双笔图形的代码++第二个汉字首双笔图形的代码+第三个汉字首双笔图形的代码+第一个汉字的声母字符+第二个汉字的声母字符+第三个汉字的声母字符。
可以计算出三字词的编码容量约为:
    25*25*25*23*23*23
    =15625*12167
    =1.9亿个(信息空间)
(4)、根据四字词的编码方式:
第一个汉字首双笔图形的代码+第二个汉字首双笔图形的代码+第三个汉字首双笔图形的代码+第四个汉字首双笔图形的代码+第一个汉字的声母字符+第四个汉字的声母字符。
可以计算出四字词的编码容量约为:
    25*25*25*25*23*23
    =390625*529
    =2亿个(信息空间)
近二十多年来,计算机中文信息处理技术从无到有,随着计算机技术日新月异的进步而不断发展,果实累累。这是专家学者、工程技术人员和相关项目设计者(发明人)共同努力的结果,展示了我国普及计算机教育和应用的广阔前景。
由于本人学识浅薄,上述汉字输入方法的缺陷乃至错误,或恐难免;因此,希望能够得到中专局专家和专利文献读者的教正!

Claims (4)

1、一种汉字输入法,包括:
(1)“札”字的五个笔画、汉字声母、韵母及声调、二十六个小写字母与键位数码、英文大写字母的对应关系
汉字“札”字的五个笔画:横=一=1,竖=丨=2,撇=丿=3,点=丶=4,折=乙=5。
汉字声母与英文大写字母的对应关系:
b=B,c=C,ch=C,d=D,f=F,g=G,h=H,j=J,k=K,l=L,m=M,n=N,p=P,q=Q,r=R,s=S,sh=S,t=T,w=W,x=X,y=Y,z=Z,zh=Z
韵母独立成音节时:a、ai、an、ang、ao的“零声母”为A;er、en、eng的“零声母”为E;ou的“零声母”为O.
汉字韵母与英文大写字母的对应关系:
a=A,ia=B,ua=B,uan=C,ao=D,e=E,an=F,ang=G,iang=H,uang=H,i=I,ian=J,iao=K,in=L,ing=L,ie=M,iu=N,o=O,uo=O,ou=P,er=Q,en=R,ai=S,eng=T,u=U,u=U,ui=V,ue=V,ei=W,uai=X,ong=Y,iong=Y,un=Z
汉字声调与英文大写字母的对应关系:阴平=11=G,阳平=22=J,上声=33=E,去声=44=0
小写字母图形、双笔图形与英文大写字母的对应关系:
g=一一=11=G,f=一丨=12=F,d=一丿=13=D,s=一丶=14=S,a=一乙=15=A,h=丨一=21=H,j=丨丨=22=J,k=丨丿23=K,l=丨丶=24=L,m=丨乙=25=M,t=丿一31=T,r=丿丨=32=R,e=丿丿=33=E,w=丿丶=34=w,q=丿乙=35=Q,y=丶一=41=Y,u=丶丨=42=U,i=丶丿=43=I,o=丶丶=44=O,p=丶乙=45=P,n=乙一=51=N,b=乙丨=52=B,v=乙丿=53=V,C=乙丶=54=C,x=乙乙=55=X,z=66=Z。
(2)输入步骤。
第一步,按汉字笔画顺序输入汉字的第一笔和第二笔;
第二步,按汉字笔画顺序输入汉字的最后二笔;
第三步,输入汉字的声母字符;
第四步,输入汉字的韵母代码字符;
第五步,输入汉字的声调代码字符。
2、根据权利要求1的输入法,其特征还在于二字词输入方法为
第一步,按汉字笔画顺序输入第一个汉字的第一笔和第二笔;
第二步,按汉字笔画顺序输入第一个汉字的最后二笔;
第三步,按汉字笔画顺序输入第二个汉字的第一笔和第二笔;
第四步,按汉字笔画顺序输入第二个汉字的最后二笔;
第五步,输入第一个汉字的声母字符;
第六步,输入第二个汉字的声母字符。
3、根据权利要求1的输入法,其特征还在于三字词输入方法
第一步,按汉字笔画顺序输入第一个汉字的第一笔和第二笔;
第二步,按汉字笔画顺序输入第二个汉字的第一笔和第二笔;
第三步,按汉字笔画顺序输入第三个汉字的第一笔和第二笔;
第四步,输入第一个汉字的声母字符;
第五步,输入第二个汉字的声母字符;
第六步,输入第三个汉字的声母字符。
4、根据权利要求1的输入法,其特征还在于四字词输入方法为
第一步,按汉字笔画顺序输入第一个汉字的第一笔和第二笔;
第二步,按汉字笔画顺序输入第二个汉字的第一笔和第二笔;
第三步,按汉字笔画顺序输入第三个汉字的第一笔和第二笔;
第四步,按汉字笔画顺序输入第四个汉字的第一笔和第二笔;
第五步,输入第一个汉字的声母字符;
第六步,输入第四个汉字的声母字符。
CNB991256085A 1999-11-23 1999-11-23 一种汉字输入法 Expired - Fee Related CN1152293C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB991256085A CN1152293C (zh) 1999-11-23 1999-11-23 一种汉字输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB991256085A CN1152293C (zh) 1999-11-23 1999-11-23 一种汉字输入法

Publications (2)

Publication Number Publication Date
CN1297187A CN1297187A (zh) 2001-05-30
CN1152293C true CN1152293C (zh) 2004-06-02

Family

ID=5284033

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB991256085A Expired - Fee Related CN1152293C (zh) 1999-11-23 1999-11-23 一种汉字输入法

Country Status (1)

Country Link
CN (1) CN1152293C (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744535B (zh) * 2014-01-10 2017-01-18 李正才 同音五笔输入法

Also Published As

Publication number Publication date
CN1297187A (zh) 2001-05-30

Similar Documents

Publication Publication Date Title
CN1026525C (zh) 智能五笔双拼码计算机汉字输入方法
CN1023916C (zh) 简繁五笔字根汉字输入系统
CN1095137C (zh) 字典检索装置
CN1549192A (zh) 手写字体的计算机识别与自动输入方法
CN101067766A (zh) 输入法中取消字符串的方法及文字输入系统
CN1152293C (zh) 一种汉字输入法
CN1136496C (zh) 简化拼音-触摸屏鼠标式汉字输入方法
CN1916940A (zh) 模板优化的字符识别方法和系统
CN101046706A (zh) 用于不同人群电脑和手机可通用的输入法
CN1059281C (zh) 汉字声韵调三拼音形编码输入方法
CN1121645C (zh) 音形字理码汉字输入方法
CN1203389C (zh) 计算机整句汉字起始四笔划输入方法
CN1347023A (zh) 二笔手写智能输入系统
CN1257445C (zh) 音义码汉字输入方法
CN1380620A (zh) 图书索引自动编排方法
CN1104673C (zh) 计算机汉字字根笔画分段输入方法
CN1150441C (zh) 字形笔顺码汉字输入法及其键盘
CN1301453C (zh) 一种汉字双拼输入法
CN1512308A (zh) 字处理方法、装置及存储介质
CN101030106A (zh) 声母韵母声标2-4码手机汉字输入法
CN1201220C (zh) 核心码计算机输入法
CN1384424A (zh) 计算机四角码汉字输入法及其键盘
CN1598743A (zh) 按规范笔顺输入汉字的输入法及其键盘
CN1838044A (zh) 中文拼音声调笔划组合输入法
CN1155115A (zh) 键位中西文输入系统及其设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C57 Notification of unclear or unknown address
DD01 Delivery of document by public notice

Addressee: Tang Jianmin

Document name: payment instructions

C57 Notification of unclear or unknown address
DD01 Delivery of document by public notice

Addressee: Tang Jianmin

Document name: Resumption of claim approval decision

C57 Notification of unclear or unknown address
DD01 Delivery of document by public notice

Addressee: Tang Jianmin

Document name: Notification to Pay the Fees

C57 Notification of unclear or unknown address
DD01 Delivery of document by public notice

Addressee: Tang Jianmin

Document name: Notification of Termination of Patent Right

C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee