CN1317735A - 一种汉字编码—“千里码”的方法 - Google Patents
一种汉字编码—“千里码”的方法 Download PDFInfo
- Publication number
- CN1317735A CN1317735A CN 00122091 CN00122091A CN1317735A CN 1317735 A CN1317735 A CN 1317735A CN 00122091 CN00122091 CN 00122091 CN 00122091 A CN00122091 A CN 00122091A CN 1317735 A CN1317735 A CN 1317735A
- Authority
- CN
- China
- Prior art keywords
- chinese character
- strokes
- code
- character
- stroke
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 11
- 238000009941 weaving Methods 0.000 claims 1
- 238000010009 beating Methods 0.000 description 3
- 241000271309 Aquilaria crassna Species 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000005251 gamma ray Effects 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明涉及一种汉字形声码(“千里码”)的编码方法。本发明按汉字笔划书写的坐标方向将笔划分成竖、横、斜、折四类,然后计算出每个汉字这四种笔划的数量(只需计算至六划),或者为了键盘输入,将数字转换成字母,依竖、横、斜、折顺序排列为主码,加上该字拼音的首字母为副码,构成数字-字母码和全字母码的汉字码-千里码。
Description
本发明所属的技术领域为汉字的编码。
本发明涉及一种根据将汉字分解为最基本的单元一笔划,并依照笔划书写的坐标方向分成竖、横、斜、折四种笔形,再计算这四种笔形的数量,同时可将数字转换成字母,依次排列成数字作主码,加上该字的拼音的首字母作付码,组成一种数字-字母码或全字母码的编码方法,这种码称之为“千里码”。
汉字编码,林林总总,基本上分成形码、声码、形声码和序号码四大类。形码和形声码基本上是将汉字分解为若干个特定的“部件”,并赋予其代号,依一定的规定顺序编成码。要记住一、二百个部件并熟练转换成代号再按键打出汉字的整个过程,不经过相当程度的训练是不易掌握的,而目前无需记忆的编码方法,往往重码太多,而要赋予种种付码。因此,汉字编码的现状是“易学的打不快,打得快的难记住”。
本发明提供了一种最简便的编码方法,既无需任何记忆,一看就明白,重码很少,可实现快打。
对《新华字典》(1998年版,下同)中收录的10400多个汉字(多音字按多个字计)的笔划作初步统计,总的笔划数为十二万三千六百左右,即平均每个汉字的笔划数为11.9,即接近12划。本发明从这点出发,找到一种计算笔划数的编码方法。
具体方法:
1,汉字的笔划,通常分成横、竖、点、撇、捺、折六种。本发明将汉字的基本笔划依照书写时在坐标轴上的走向压缩为四种笔形:即沿纵坐标垂直走向的垂笔,沿横坐标水平走向的平笔,沿纵横坐标之间走向的斜笔和书写过程改变方向的弯笔。垂笔包括通常说的竖笔,平笔包括通常说的横笔,斜笔包括通常说的点、撇、捺、提,弯笔包括通常说的各种折笔。为了习惯的需要,亦可将垂、平、斜、弯四笔叫为竖、横、斜、折。
根据对《新华字典》中10400多个汉字的初步统计,在总共十二万三千六百左右的笔划中,竖笔有二万二千二百左右,横笔有三万四千七百左右,斜笔四万三千五百左右,折笔有二万三千左右,也就是说平均每个汉字有竖、横、斜、折四种笔形分别为2.1、3.3、4.2和2.2划。
2.笔划的排列按竖、横、斜、折的顺序而不是按常规横、竖、斜、折。将竖笔排在横斜笔前面的理由是依据这些笔划在汉字中出现的频率。根据对《新华字典》的初步统计,在10400多个汉字中:
无竖笔的汉字有1345个;
无横笔的汉字有513个(其中259个出现在无竖笔的汉字中);
无斜笔的汉字有368个。
按竖、横、斜、折顺序排列时,前面第一位为零的编码有1345个,前二位为零的编码有259个。这样在输入这些汉字编码时,前面的零可以省去而减少击键次数,采用竖、横、斜、折顺序编码可以最大限度提高汉字输入速度。
3.本发明的汉字编码分为主码与付码。主码有数字码和字母码两种。数字主码即为该汉字的竖、横、斜、折笔划数依次排列组成。为了键盘输入的需要,数字以字母表示,左手键盘f、d、s分别代表单数1、3、5,右手键盘j、k、l分别代表偶数2、4、6;o代表0。这样构成字母主码。付码为该汉字的拼音的首字母,如果该字为不同字首的多音字时,可有多个付码,因此就有多个不同的编码,输入时,可用其中任何一种。
4.在计算竖、横、斜、折四种笔划时,只需计算至6划,超过6划仍作6划处理。根据《新华字典》中10400多个汉字的统计,竖笔超过6划的汉字只有101个,横笔超过6划的汉字有747个,斜笔超过6划的较多,为1684个,折笔超过6划的最少,为48个。为了提高笔划的计算速度,只需计算至6划,超过6划,仍作6划计。主码的数字只有0-6七个数字,转换成字母也只有七个字母。
5.本发明适用于简体和繁体汉字的编码,在输入繁体字时还可用对应的简体字码再加上“简-繁”字转换码。
6.本发明亦适用于词和词组的编码。
7.本发明中的全字母码适用于汉字输入(如电脑输入),数字-字母码适用于汉字的检索(如字典的检索)。
本发明可用下面的实施例加以说明:
实施例1:
汉字“课”字分别有2竖、3横、3斜(点、撇、捺各一笔)、2折,读音“ke”,编码为2332k,可转换成jddjk全字母码。
实施例2:
汉字“了”字分别有0竖、0横、0斜、2折,即0002,而前面的“0”不必写,主码为2,付码为1,全码为21,可转换成jl全字母码。
实施例3:
汉字“正”字,竖、横、斜、折数分别为2、3、0、0,主码为2300,后面的零不能省去。付码为z,全码为2300z,可转换成jdooz全字母码。
实施例4:
汉字“罐”字分别有竖、横、斜、折8、9、3、3,计算时只需计算至6,因此主码为6633,全码为6633g,可转换成llddg全字母码。
实施例5:
汉字“伽”读音有三种:“ga”(伽马射线),“jia”(伽利略),“qie”(伽南香)。因此,其编码也有三个,即:2122g,2122j,2122q,可分别转换成jfjjg,jfjjj,jfjjq全字母码。
Claims (7)
1.一种将汉字的基本笔划按书写的坐标方向分成竖、横、斜、折四种笔形的方法。
2.根据权利1,将汉字的四种笔形的数量按竖、横、斜、折的顺序编成汉字的数字码为主码的方法。
3.根据权利1、2,将数字码中的数字1、2、3、4、5、6、0分别转换成为字母f、j、d、k、s、l、o,构成字母码的方法。
4.根据权利1、2,加上汉字拼音的首字母为付码,主付码构成数字-字母码,适用于汉字检索。
5.根据权利1、2、3,加上汉字拼音的首字母为付码,构成全字母码,适用于汉字输入。
6.根据权利1、2、3,在计算笔划数时,某一笔划数超过6时,只需计算至6。超过6划仍作6划处理。
7.根据权利1、2、3,主码前面的0和o可以省去。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CNB001220918A CN1138198C (zh) | 2000-08-27 | 2000-08-27 | 千里码——一种简易的汉字编码计算机输入方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CNB001220918A CN1138198C (zh) | 2000-08-27 | 2000-08-27 | 千里码——一种简易的汉字编码计算机输入方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN1317735A true CN1317735A (zh) | 2001-10-17 |
| CN1138198C CN1138198C (zh) | 2004-02-11 |
Family
ID=4589083
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CNB001220918A Expired - Fee Related CN1138198C (zh) | 2000-08-27 | 2000-08-27 | 千里码——一种简易的汉字编码计算机输入方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN1138198C (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9648734B2 (en) | 2013-03-13 | 2017-05-09 | Taiwan Semiconductor Manufacturing Company, Ltd. | Wafers, panels, semiconductor devices, and glass treatment methods |
-
2000
- 2000-08-27 CN CNB001220918A patent/CN1138198C/zh not_active Expired - Fee Related
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9648734B2 (en) | 2013-03-13 | 2017-05-09 | Taiwan Semiconductor Manufacturing Company, Ltd. | Wafers, panels, semiconductor devices, and glass treatment methods |
Also Published As
| Publication number | Publication date |
|---|---|
| CN1138198C (zh) | 2004-02-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN1317735A (zh) | 一种汉字编码—“千里码”的方法 | |
| CN1022781C (zh) | 一种汉字笔形编码的计算输入方法 | |
| CN101266519A (zh) | 一种汉字拼音识别码输入法 | |
| CN87105289A (zh) | 汉字形音编码法 | |
| CN85100094A (zh) | 汉字拼音联想编码及双拼键盘 | |
| CN1036359C (zh) | 计算机汉字反切编码输入法 | |
| CN1032986C (zh) | 笔顺码计算机汉字输入方法 | |
| CN1164982C (zh) | 汉字易码输入方法 | |
| CN1089458C (zh) | 汉语识字码输入法 | |
| CN1161497A (zh) | 汉语字词全息编码计算机输入方法及键盘 | |
| CN1040259C (zh) | 二笔字画编码法及二笔字画键盘 | |
| CN1055826A (zh) | 中华汉字编码输入方法 | |
| CN1116336A (zh) | 替调式汉语拼音汉字、词输入编码法及键盘 | |
| CN1046402A (zh) | 形音符汉字、符号编码法及其键盘 | |
| CN1182456C (zh) | 汉字音形数码输入方法 | |
| CN1153334A (zh) | 计算机汉字“字块编码”方案 | |
| CN1030867C (zh) | 音素易码输入法 | |
| CN1189810C (zh) | 五角形四角号码汉字输入法 | |
| CN1202463C (zh) | 数字编码汉字输入方法 | |
| CN1282903A (zh) | 五笔画形声输入法及其键盘 | |
| CN1388430A (zh) | 现代汉语音文输入法 | |
| CN1164695A (zh) | 汉字笔形数值编码法 | |
| CN1241100C (zh) | 同一声形数码汉字输入法 | |
| CN1107256C (zh) | 一种汉字右码计算机输入方法 | |
| CN1121006C (zh) | 计算机汉字输入方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C06 | Publication | ||
| PB01 | Publication | ||
| C14 | Grant of patent or utility model | ||
| GR01 | Patent grant | ||
| C19 | Lapse of patent right due to non-payment of the annual fee | ||
| CF01 | Termination of patent right due to non-payment of annual fee |