HK1167480B - 一体式中文字输入方法 - Google Patents
一体式中文字输入方法 Download PDFInfo
- Publication number
- HK1167480B HK1167480B HK12107978.7A HK12107978A HK1167480B HK 1167480 B HK1167480 B HK 1167480B HK 12107978 A HK12107978 A HK 12107978A HK 1167480 B HK1167480 B HK 1167480B
- Authority
- HK
- Hong Kong
- Prior art keywords
- chinese
- user
- input
- characters
- string
- Prior art date
Links
Description
发明人:Clement Lee
背景技术
数以百万计的因特网用户每天访问网站查看不同语言的web内容。世界上的大多数计算机允许用户键入拉丁字母,这些拉丁字母也被用于英语。然而,存在许多不是基于拉丁字母(或罗马字母)的语言,并且许多web内容是基于这些其它语言的。当用户想要使用计算机或其它类型的计算设备(诸如个人数字助理(PDA)和蜂窝电话)来输入字符时,计算设备需要具有允许这样的输入并识别这些字符的程序。
“输入法”是允许用户输入未在他们的输入设备上找到的字符和符号的操作系统组件或程序。例如,输入法允许用户利用计算机键盘来输入中文字、日语字、韩语字和印度语字。在Microsoft WindowsTM操作系统中通常称为输入法编辑器(IME)。其它操作系统可以具有他们自己的针对所谓的“输入法”的名称。
对于具有多种输入法的语言,用户可以选择输入法并使用所选方法来输入字符。如果用户想要使用另一输入法来写入(或输入)字符,则用户需要采取诸如定位该另一方法并选择该另一方法之类的动作,以切换到该另一输入法。
本发明的实施例是在这样的背景下产生的。
发明内容
本发明的实施例描述了用于利用组合式(或一体式)中文输入法在计算机或网站上的文档和窗体中输入中文字的系统和方法。该组合式中文输入法包括用户频繁使用的多个中文输入法。与用户键入的符号串相匹配的中文字自动地被生成并被显示在每种中文输入法的下面,供用户选择所希望中文输入法下面的正确字。组合式中文输入法允许用户写入(或输入)中文字而不用指定所使用的中文输入法,这减少了切换输入法所用的时间。此外,组合式中文输入法还可以被个性化以包括用户频繁使用的或指定的中文输入法。与被输入来形成中文字的符号串相匹配的中文字的显示也可被个性化,以增强可用性并提高标识出相匹配中文字的速度。
应当理解,本发明可以以包括方法、系统或设备的多种方式来实现。下面描述了本发明的数个创造性实施例。
在一个实施例中,提供了一种实现中文输入方法的电子设备。该方法包括接收来自用户的使用组合式中文输入法的请求。该方法还包括接收用户顺序键入的第一符号串。第一符号串被用来输入第一中文字。该方法还包括显示组合式中文输入法中所包括的多种中文输入法的与第一符号串相匹配的中文字。该显示提供用于第一中文字的选项的图形图示说明,每个选项来自组合式中文输入法中的不同输入法。另外,该方法包括接收指示所显示中文字中的一个被选作第一中文字的信号。
在另一实施例中,提供了一种实现个性化的中文输入方法的电子设备。该方法包括:接收来自用户的使用组合式中文输入法的请求;以及在接收到来自用户的使用组合式中文输入法的请求之后,标识用户以及用户的中文输入历史。该方法还包括:基于用户的中文输入历史来标识用户使用过的多种中文输入法以及多种中文输入法的从最频繁使用的方法到最不频繁使用的方法的顺序。多种中文输入法是组合式中文输入法的一部分。另外,该方法包括接收用户输入的第一符号串。第一符号串被用来输入第一中文字。另外,该方法包括:针对多种中文输入法中的每种,标识与用户输入的第一符号串相匹配的中文字;以及针对多种中文输入法中的每种,按照从最频繁或最近输入的字到最不频繁或不是最近输入的字的顺序来对所标识中文字排序。此外,该方法包括:显示所包括的多种中文输入法的、与用户输入的第一符号串相匹配的中文字。经排序的相匹配中文字被显示在多种中文输入法中的每种的下面。多种中文输入法按照从最频繁使用的方法到最不频繁使用的方法被显示。该方法还包括:接收指示所显示中文字中的一个被选作第一中文字的信号;以及在显示屏上显示所选第一中文字。
在又一实施例中,提供了一种用于在无需指定中文输入法的情况下输入中文字的系统。该系统包括组合式中文输入程序。该组合式中文输入程序被配置为针对多种中文输入法来标识与用户输入的符号串相匹配的中文字。系统的用户在输入符号串之前不需要指定中文输入法。该系统还包括中文输入显示生成器。该中文输入显示生成器与组合式中文输入程序交互以生成多种中文输入法的所标识中文字的显示。
附图说明
结合附图通过下面的详细描述将容易理解本发明,并且相似的标号指示相似的构件。
图1A示出了根据本发明一个实施例的用于输入繁体中文字的中文(台湾)键盘布局。
图1B示出了根据本发明一个实施例的安装有中文输入法编辑器(IME)的计算系统。
图1C示出了根据本发明一个实施例的在操作中文IME之后文档上的显示。
图1D示出了根据本发明一个实施例的在操作中文IME之后文档上的显示。
图1E示出了根据本发明一个实施例的在操作中文IME之后文档上的显示。
图1F示出了根据本发明一个实施例的在操作中文IME之后文档上的显示。
图1G示出了根据本发明一个实施例的在操作中文IME之后文档上的显示。
图2A示出了根据本发明一个实施例的Yahoo!TM香港的输入页面。
图2B示出了根据本发明一个实施例的通过多种中文输入法输入的中文字串。
图2C示出了根据本发明一个实施例的在操作组合式中文输入法之后的搜索页上的显示。
图2D示出了根据本发明一个实施例的在操作组合式中文输入法之后的搜索页上的显示。
图2E示出了根据本发明一个实施例的在操作组合式中文输入法之后的搜索页上的显示。
图2F示出了根据本发明一个实施例的在操作组合式中文输入法之后的搜索页上的显示。
图2G示出了根据本发明一个实施例的在操作组合式中文输入法之后的搜索页上的显示。
图2H示出了根据本发明一个实施例的在用户输入一串中文字和英语单词之后的搜索页上的显示。
图2I示出了根据本发明一个实施例的可用于使用户的组合式中文输入法个性化的按钮。
图2J示出了根据本发明一个实施例的供用户选择来包括在用户的个性化组合式中文输入法中的中文输入法列表。
图3A示出了根据本发明一个实施例的允许用户在搜索框中输入中文字的系统。
图3B示出了根据本发明一个实施例的用户2的搜索页。
图4A示出了根据本发明一个实施例的在搜索站点中的搜索框中进行中文输入的处理流程。
图4B示出了根据本申请一个实施例的用户使用个性化组合式中文输入法的处理流程。
具体实施方式
如上面提到的,数以百万计的因特网用户每天访问网站查看不同语言的web内容。当人们使用计算机或其它类型的计算设备(诸如个人数字助理(PDA)和蜂窝电话)来输入非拉丁词时,计算设备需要允许这样的输入并识别这些字符的程序。上面还描述了“输入法”是允许用户输入未在他们的输入设备上找到的字符和符号的操作系统组件或程序。输入法允许用户利用标准计算机键盘和接口来输入非拉丁字符,例如中文字、日语字、韩语字和印度语字。
实际上人口的大约五分之一或者超过十亿人讲某种形式的汉语来作为他们的母语。也称为汉字(Han character)的汉语字是在书写汉语(hanzi)、日语(kanji)以及有些时候的韩语(hanja)时使用的意音文字(logogram)。中国康熙字典中包含的中文字数目为大概47035个,尽管这些中文字中的大量中文字是在历史上累积的很少使用的变体。在中国进行的研究表明,完全掌握中文只需要三到四千字的知识。在中国文字系统中,字是音节形态式的(morphosyllabic)。每个字通常对应于具有基本含义的口语音节。然而,尽管中文词可以由具有基本含义的字形成,但是普通话中的大多数词语需要书写两个或更多个字(因此是多音节的)。通常词语具有与组成它们的字不同的含义。各种中国方言中的具有相同或类似含义但发音不同的同源词可以利用相同字来书写。
对于频繁使用的三到四千字来说,大多数中国人知道每个字如何发音以及每个字是看起来什么样子的。然而,对于未被频繁使用的字来说,人们可能难以知道如何发音和/或形成这些字的精确笔画。对于不属于最频繁使用的组(例如,三到四千字)中的字来说,这些字的发音以及知道精确笔画将是更具有挑战性的。
中文使用意音脚本(logographic script),其是一种一个或多个“字”大致对应于一个“词”或含义的脚本。与标准计算机键盘上的键相比,存在多得多的字或字形。已设计出多种键盘输入法编辑器(IME)以允许利用标准键盘输入中文字。用于中文的键盘输入法可被划分为三个主要类型:
·通过发音,
·通过字型,
·通过编码。
对于每种类型的中文键盘输入法来说,存在多种方法。例如,存在如下所示的依赖于发音的三种示例性键盘输入法。
发音:
·拼音法在中国大陆被使用并且在台湾也越来越多地被使用,
·注音法仅在台湾使用,以及
·粤语语音法(或广东拼音)主要在香港使用。
另外,存在许多基于字型的键盘输入法。下面列出了一些示例。
字型:
·仓頡输入法,
·简易仓颉输入法(速成),
·纵横输入系统(CKC Chinese Input System),
·呒虾米(Boshiamy)输入法,
·大易输入法,
·行列输入法,
·四角输入法,
·Q9输入法,
·首尾输入法,
·笔画数输入法,
·笔画输入法,
·五笔输入法,
·五笔划输入法,
·郑码输入法,
·首尾号码输入法,以及
·笔结码输入法(Knot DNA)。
此外,还存在一些基于发音和字型(或编码)的组合的键盘输入法。下面列出两个示例。
发音和字型的组合:
·子来输入法,以及
·认知码输入法。
这些输入法中的许多具有变体。例如,“全拼”和“双拼”是“拼音”输入法的变体。另外,要求用户从菜单中选择字的输入法有时具有用于基于上下文来猜测用户意图写入(或输入)的字的复杂方法。
中文键盘就是在键上印有中文输入法标签的US布局(例如,QWERTY键盘)。如果在操作系统中选择US键盘布局,则无需输入法处理程序,这些键盘可对应于拉丁字符。当前简体字在中国大陆使用,而繁体字在台湾和香港使用。大多数现代输入法允许输入简体字和繁体字两者,但是它们仅基于本地设置默认其中一者或另一者。然而,用户不需要中文键盘来输入中文字。因此,只要IME在用户的桌面上可用(或可访问),用户就可以通过按压键盘上具有拉丁字符的键来输入中文字。
台湾的计算机通常使用注音(注音字母)类型的键盘(带有注音字母标签的US键盘),许多还具有仓颉法键标签,这是因为仓颉是快速键入繁体字的标准方法。注音字母类型的键盘是从上到下从左到右的词典编纂顺序。在(繁体)中文键盘上通常印有三种输入法的代码:注音(右上)、仓颉(左下)和大易(右下)。图1A示出了用于输入繁体中文字的(台湾)中文键盘。在香港,发现有(台湾)中文键盘和US键盘两者。除了输出字是繁体中文以外,诸如汉语拼音(或简单地,拼音)之类的其它输入法与简体中文的相同。在中国大陆使用的键盘通常使用英语US(美国)键盘并且使用汉语拼音(或简单地,拼音)来输入中文字,汉语拼音利用拉丁字母来表示中文字的读音。
上面提到的每种中文输入法具有其优缺点并且其使用因人而异。例如,对于已经熟悉拼音的人来说,可以立即学会拼音输入法。然而,最大打字速率是有限的并且对于不熟悉拼音(或汉语拼音)的那些人来说学习该系统可能是困难的。五笔输入法要花很多时间去学习,但是熟练的打字员利用它来输入文本可以比利用诸如拼音输入法或注音输入法之类的语音方法快很多。由于这些因素,形成“标准”方法的可能性很小。一些人喜欢仅使用一种方法,而其他人使用多种方法来输入中文字。许多人可以使用多种方法,并且利用一种方法键入某些字而利用另一方法键入其它字是惬意的。例如,由于大多数香港人讲广东话,因此在香港长大的人可能更熟悉广东话语音输入法(或广东拼音,或者简单地,广东法)。另外,许多香港人正越来越熟悉拼音输入法。此外,为了高输入速率,许多香港人被训练使用仓颉输入法和/或简易仓颉输入法。因此,许多香港人在打字时会使用他们知道的多种方法。
如上所述,存在许多唯一的中文字。用户可能知道某些字的样子及其含义,但是他们可能不知道这些字中的一些字如何发音。在此状况下,用户可以使用基于字型的IME。替代地,用户可能知道某些字(或词)的读音,但是他们不知道这些字到底是什么样子。他们可能只知道这样的字的关键特征(或者这些字大概的样子)。在此状况下,用户可以使用基于发音的IME。此论据进一步说明许多中文用户(不仅在香港)知道用于输入中文字的一种以上的输入方法。
当前,当用户想要输入中文字时,用户需要下载特定输入法的中文IME或者包含多种输入法的中文IME。图1B示出了根据本申请一个实施例的具有安装在计算机100上的中文IME(不可见的软件)的计算机屏幕105。计算机100具有带有不同键的键盘106。该计算机的默认键入模式是英文(EN)。在计算机屏幕105上,存在示出了字输入法的中文输入按钮111。中文输入按钮111可以位于屏幕105上的任何地方。通常,按钮111位于屏幕105顶部或底部的工具栏(例如工具栏130)上。如果字输入法为英语,则按钮111显示“EN”。计算机屏幕105具有描述中国的WORDTM文档107。
如果用户想要在文档107中在由位置条108指示的位置处的“Peking”后面的左括号之后键入表示“Peking”的两个中文字“北京”,则用户需要点击中文输入按钮111来切换输入模式。根据本发明一个实施例,在用户点击按钮111之后,选择栏115出现,如图1C所示。在选择栏115中,存在三种输入法。一种方法是“英文”输入法116(用符号“EN”表示),其已被选中并且是当前被选择的输入方法(字符输入或单词输入)。其它两种是包括“拼音”法117(CH1)和“仓颉”法118(CH2)的中文输入(或中文字输入)。用户可以选择它们中的任一者来输入中文字。根据本申请一个实施例,如果用户点击拼音(拼音)法117,则用户可以利用拼音法来输入中文字并且选择栏115缩小为其中“CH1”(或拼音法)被选择的按钮111',如图1D所示。
如上所述,用户想键入两个中文字“北京”(Peking)。在一个实施例中,用户可以键入“bei3”(带有声调的拼音)或“bei”(仅拼音)来创建“北”字,并且键入“Jing0”(带有声调的拼音)或“jing”(仅拼音)来创建“京”字。第一个字“北”的带有声调的拼音的字母数字串为“bei3”。当用户在区域125中键入字母数字串“bei3”的(一个或多个)字母数字符号“b”或“be”时,在区域120中将存在具有以“b”或“be”开始的拼音的中文字列表,如图1E所示。不是以“b”或“be”开始的所有中文字被过滤掉。如果用户仅键入单个字母“b”,则对于拼音法来说将存在大量的以“b”开始的中文字。如果用户键入第二个字母“e”来组成“be”的组合,则该输入法将进一步过滤掉以“b”开始但是不具有“be”的组合的那些字。
在一个实施例中,在每个字前面具有选择编号。例如,“北”字的前面具有选择编号2。用户可以点击“2北”的区域121来选择“北”字或者在“be”之后继续键入“i”。用户还可以点击区域122来扩展相匹配的中文字列表。在区域120中所显示的中文字不一定仅在一列中垂直地被列出。区域120中的中文字还可以是具有多行多列的二维式的。
根据本发明一个实施例,在键入“bei”后,将出现经过滤的新的匹配字列表,其包括前面具有选择编号2的“北”字,如图1F所示。再次地,用户可以点击“2北”来选择“北”字或者在“bei”之后继续键入“3”。“bei”之后的“3”标识出“北”字的高声调。一旦全部“bei3”被键入,“北”字将自动输入位置条108的位置中,如图1G所示。新的位置条109移动到“北”字后面的新位置。可以利用拼音法或利用仓颉法以类似方式写入(或输入)“京”字。如果用户想切换为仓颉法以输入字,则用户需要通过使用按钮111'(或111)来选择“CH2”(或仓颉法)。
从一种中文输入法切换为另一种中文输入法是费时的。上面的示例仅示出了两种方法。如上所述,存在许多中文输入法。用户可以将多种中文输入法下载到其计算机上。当这种情况发生时,在用户的计算机屏幕105上将存在一个以上的按钮来供用户选择中文输入。用户需要通过点击计算机屏幕105上的各个中文输入法按钮来改变输入法,从而选择用于输入中文字的所希望方法。
上述中文输入法也适用于用户(用户A)正在搜索框中输入中文字的情况。图2A示出了根据本发明一个实施例的Yahoo!TM香港的输入页200。用户A输入诸如“swine flu”之类的英语词汇来搜索与猪流感有关的内容。如果用户A想搜索与“北京”(Peking)有关的中文内容,则用户A通常键入中文字来进行搜索。用户A需要选择一种或两种方法来输入两个中文字“北京”(Peking),如上面在图1B-图1G中描述的。如前所述,为了输入中文字,用户A需要通过点击输入法按钮111来选择用户A想用来写入(或输入)中文字的(一种或多种)方法,从而切换字输入法。
随着用户A想输入搜索框210内的中文字数目的增多,用户A使用一种以上方法来输入中文字的可能性越大。用户A可能需要来回地切换方法以键入特定中文字。图2B示出了用户A在搜索框210中输入的5个中文字。用户A使用3种中文字输入法来输入“香港的餐廳”(香港的餐厅)。第一个字用方法1输入,并且第二个字用方法2输入。用户A切换回方法1来输入第三个字,并且然后切换到方法3来输入第四个字。对于最后一个字,用户A切换为使用方法2。从图2B的示例可清楚,对于用户A来说切换方法是不方便的。
用户A可能希望利用任意字输入法来自由地键入,而无需切换或选择针对用户A正输入的特定中文字的选择的方法。
图2C示出了根据本申请一个实施例的显示出自动地从多种中文输入法获得的相匹配中文字的组合式(或一体式)中文输入法。图2C示出了具有搜索框210(其与图2A的搜索框210相同)的搜索输入页200'。在搜索框210旁边,具有组合式输入法按钮211,其类似于图2A的输入法按钮111。差别在于图2A的输入法按钮111是由利用用户的工具栏130进行操作的程序生成的,而输入法按钮211是由呈现搜索页200'的网站生成的。由于用户A想输入中文字,因此用户A点击按钮211以选择中文;因此,“CH”(中文的缩写)被示出在按钮211中。
在图2C的示例中,用户A想在搜索框210中的位置208'处输入“香”字(“香港”的香)。该字将出现在由告知鼠标的位置的垂直条所标识的位置208'处。在搜索框210下面,有用于输入形成所希望中文字所需的字母数字符号的输入框215。在输入框215下面,存在栏220,其示出了组合式中文输入法中的一些中文输入法中的与所输入的(一个或多个)字母数字符号相匹配的中文字。在图2C所示的示例中,在组合式中文输入法中存在3种中文输入法,包括区域221中的“广东法”(广东)、区域222中的“简易仓颉法”(速成)以及区域223中的“拼音法”(拼音)。在每种方法下面,存在诸如栏(或选项)224、225和226之类栏,其示出了该特定方法中与所输入的(一个或多个)字母数字符号相匹配的中文字。
图2C示出了:当用户A键入第一个字母“h”时,栏224、225和226的每个示出该特定方法中与字母“h”相匹配的多个中文字。中文字输入程序针对所示出的三种方法过滤掉不是以“h”开始的所有中文字。例如,栏224示出了在“广东法”中可以通过使第一个字母为“h”来形成的中文字C1,C2,…,CN。N是整数并且可以是任何数。由于可用于显示的空间有限,因此,例如N可以为10。在CN下面,可以存在按钮“更多”227,用户A可以推按它来获得更多的相匹配中文字。例如,对于“广东法”,可以存在第一个字母为“h”的100个以上的字。类似地,在栏225中的“简易仓颉法”中存在多个相匹配中文字S1,S2,…,SN,并且在栏226中的“拼音法”中存在多个相匹配中文字P1,P2,…,PN。呈现搜索站点(或网站)的一个或多个计算机系统不知道用户意图使用的中文输入法。对于“广东法”相匹配的总字数为I(其是整数)。对于“简易仓颉法”相匹配的总字数为J,并且对于“拼音法”相匹配的总字数为K。
为了进一步缩窄选择,用户A输入第二个字母“o”。中文输入软件程序过滤掉不是通过以字母“ho”开始而形成的中文字。图2D示出了与以“ho”开始的要求相匹配的多个中文字。图2D的栏224、225和226中的字数应当比图2C的栏224、225和226中的字数少,因为在“h”之后通过附加的“o”来对字库进行了进一步过滤。在图2C中,“广东法”中相匹配的中文字数已被减少为I',I'为整数并且等于或小于I。类似地,“简易仓颉法”中相匹配的中文字数已被减少为J',并且“拼音法”中相匹配的中文字数已被减少为K'。J'和K'都为整数。J'等于或小于J,并且K'等于或小于K。在“h”之后输入附加的“o”后,三种方法的相匹配中文字的列表重新被创建。以“h”开始但不以“ho”开始的字被过滤掉。
图2E示出了在“ho”之后通过“n”进一步进行过滤的相匹配字。在此再次过滤之后,中文字“香(Hong)”出现在“广东法”的编号1中。用户A可以点击包括编号“1”和“香(Hong)”字的栏240。通过该选择,中文字“香(Hong)”将被置于位置208'中。替代地,用户A可以使用附加的过滤来挑选目标字。例如,如果用户A在“hon”之后输入附加过滤“g”,则仅三个字与“hong”相匹配,其中,每种方法中非常少的相匹配字将仍然存在,这可以使用户A更容易选择。上面的示例示出了用户A知道中文字“香”(Hong)的广东话方法的字母。
在中文字“香”被选择之后,该字被置于搜索框中,如图2G所示。光标移动到下一位置109'并且用户A可以输入字母数字符号来形成第二个中文字“港(Kong)”。
在一个实施例中,程序(或带有该程序的系统)可以在用户A仅键入“h”或“ho”之后就在位置108'中填入字(例如“香”),而不是在栏220中显示出完整的字列表。这在以符号“h”或“ho”开始的字(例如“香”)最近被用户A输入过或者非常频繁地被用户A输入时可以发生。该程序可以自动选择可能的候选来填入位置108'。如果自动选择的字不是正确的字,则用户A可以点击空间108'中的自动选择的字并且与图2C或图2D的栏220中的字列表类似的完整字列表将出现供用户A选择。用户A可以输入(一个或多个)附加符号来选择相匹配字以找到相匹配字。在此实施例中,系统(或程序)猜测选择中文字的用户A的意图。这样的实施例对于非常频繁地使用中文输入法的用户来说可以是非常有用的,这是因为使用历史被跟踪。如果用户与网站交互,则可以通过安装在用户的计算设备上的cookies来跟踪使用历史。替代地,如果用户在个人计算机上的文档或窗体中输入中文字,则可以由用户的个人计算机来跟踪(或存储)使用历史。
用户A可以使用上述三种输入法中的一种来输入中文字,而不用通过点击输入法按钮来手动地从一种方法切换为另一种方法。再次地,图2C-图2G所示的三种方法仅仅是示例。中文字输入法的数目可以被扩展为更多个,或者可以少于3个。示出另外的方法的另外的栏可以被显示在栏220中。
上述方法允许用户A输入一串中文字,而不用为在输入每个字之前选择输入法而烦恼。用户A可以使用他/她惬意的或熟悉的方法来输入中文字而不用进行手动切换。当用户A键入字母数字符号时,用户A只需要挑选出特定方法下用户A想到的相匹配字。用户A还可以输入混有中文字和英文单词的一串字。当用户A想要(一个或多个)英文单词时,用户A只需要点击按钮211来切换到英文。图2H示出了用户A在搜索框210中输入“香港restaurant”。中文字是通过以上描述的方法输入的,而单词“restaurant”是通过将方法按钮211切换为英文(或“EN”)而输入的。当用户A在搜索框210中输入所有字和单词之后,用户A可以推按搜索按钮212来启动搜索。
上述中文输入法允许用户输入中文搜索关键词,而无需首先制定特定中文输入法。还允许用户在字输入期间从一种方法切换为另一种而无需按压键或按钮来指定要使用的方法。输入法中用户经常使用或选择的相匹配中文字的结果一起被显示以供用户选择字。在图2C-图2J所示实施例中,程序驻留在诸如Yahoo!香港之类的搜索站点上。搜索站点知道其客户群并且知道最受其用户欢迎的中文输入法。登录到其帐户的用户可以享受更多的定制,或者可以在cookies的帮助下保存最近的历史。搜索网站可以创建用于组合最受欢迎的中文字输入法以使得用户能够在无需指定方法的情况下输入中文字的程序。
图2C-图2H所示的组合式中文输入法具有由搜索系统预先选出的三种中文输入法。替代地,搜索站点可以允许用户选择用户喜欢的输入法。图2I示出了根据本申请一个实施例的在输入法按钮211之后具有“My CHIME(我的中文输入法)”按钮213。如果诸如用户A之类的用户点击按钮213,则具有中文输入法列表的页面250被示出给用户以选择将被包括在组合式中文输入法中的中文输入法。用户A可以选择其频繁使用的多种方法。
图3A示出了根据本发明一个实施例的用于使得用户能够在搜索框中输入中文字而无需首先指定中文输入法并且无需在中文输入法之间切换的系统300。在系统300中,存在与计算设备302交互的用户1301。计算设备302具有屏幕303和键盘304。例如,计算设备302可以是计算机、个人数字助理(PDA)、蜂窝电话或其它计算设备。计算设备302可以是具有用于显示web内容的屏幕以及供用户1301输入(或键入)字母数字符号的键盘(或物理屏或触摸屏)的任何类型的计算设备。用户1301与计算设备302交互以访问搜索系统310。搜索系统310为想要搜索信息的用户创建搜索输入页面,并且向用户返回搜索内容。搜索系统310具有搜索引擎311、内容存储装置312、搜索页面生成器313、广告引擎314以及中文输入程序315。中文输入程序315组合多种中文输入法以允许用户在搜索框中键入中文字而不用指定用于形成特定中文字的特定中文输入法(或输入法)。计算设备302经由因特网305访问搜索系统310。搜索系统310访问连接到因特网305的诸如网站1321至网站X 322之类的网站。搜索系统310访问的网站数目,或数目X可以是任意整数。
当用户1访问搜索系统310的搜索站点时,该搜索站点可以已经知道用户1的身份以个性化用户1的搜索体验。例如,当用户搜索Yahoo!TM时,用户中的许多用户由Yahoo!TM通过安装在用户计算设备上的Yahoo!TMcookies来标识。在一个实施例中,网站上可用的组合式(或一体式)中文输入法被个性化。搜索站点(或搜索系统310)可以跟踪用户1的中文输入历史并且知道用户1优选的输入法。图3B示出了根据本发明一个实施例的用户2的搜索页面340。诸如Yahoo!TM香港之类的搜索站点知道用户2的身份。搜索站点还知道用户2的优选输入法是“拼音法”,其次是“广东法”。因此,当用户2输入字母数字符号以生成中文字时,按照首先为“拼音法”然后为“广东法”的顺序来组织所显示的相匹配字,如图3B所示。搜索系统310可以通过存储在用户的中文输入历史316中的中文输入历史或者通过检查用户2选择的(一种或多种)中文输入法来标识用户2的优选输入法,如图2J所示。这样的个性化使得用户2能够仅查看他们最有可能使用的方法下的相匹配中文字,并且将产生更快的字检索和更好的用户体验。
在搜索系统310可以标识出用户2的(一种或多种)优选中文输入法之前,搜索系统310可以提供默认中文输入法供用户2使用,直到用户2的充足中文输入历史被构建或者直到用户2标识出(一种或多种)优选输入法为止。一旦用户2的中文输入历史充分地被建立或者用户2已标识出(一种或多种)优选输入法,则系统310可以示出用户2最频繁使用的最前面的一些中文输入法或者由用户2选择的(一种或多种)优选输入法。这样的个性化可以有助于用户具有更好的中文输入体验并且使能更快的字检索。
为了使能个性化的中文输入,搜索系统310具有用户简档模块317,其运行搜索系统310标识用户(如用户2),如图3A所示。用户简档模块317存储用户的标识以及关于用户的信息,例如,他们的年龄、性别、地理位置、收入水平以及过去的搜索关键词等。用户简档信息帮助搜索站点匹配将与搜索结果一起显示的广告。广告以可通过用户简档来标识的不同类型的用户为目标。用户简档信息还帮助搜索站点提供与用户相关的信息。除了用户简档模块317之外,搜索系统310还包括用户的中文输入历史存储装置316,其存储包括用户输入的中文字以及用户所使用的关联中文输入法在内的信息。在一个实施例中,存储在用户的中文输入历史316中的信息可被用来将用户之前频繁输入的字(单词)置于相匹配字的列表的顶部。在一个实施例中,系统310还包括中文输入显示生成器318,其与中文输入程序315、用户的中文输入历史316一起工作来生成以上附图(例如图2C-图2G)中所示的相匹配中文字的显示。
如上面在图3B中提到的,搜索系统310知道用户2的(一种或多种)优选输入法。另外,图3A的存储装置316中的数据指示用户2已输入过中文字“bei3(北)”许多次。因此,当用户2输入用于中文字“北(north)”的字母数字符号“bei2”时,搜索系统可以在用户2仅输入“b”或“be”时就在列表的顶部呈现“北(north)”。图3B示出了当用户2输入“be”时搜索系统310分析存储装置316中的数据并且得知以“be”开始的、用户2最常输入的中文字是“北(north)”。搜索系统310将“北(north)”置于“拼音法”的顶部。由于“北(north)”字(拼音法的编号1中)是用户2想要输入的字,因此用户2可以容易地选择该字。用户2不必键入全部“bei3”来找出中文字“北(north)”。替代地,搜索系统310可以分析用户2的中文字输入历史并且可以找出以“be”开始的、用户2最近输入过的中文字为“北(north)”。系统可以将与用户2输入的“be”相匹配的该最近输入过的中文字置于列表的顶部。用户通常在搜索期间输入相关搜索关键词来找出与主题有关的信息或者细化搜索。搜索系统310可使用不同算法来确定相匹配字的排序。
这样的个性化中文输入法将提升用户体验并且使用户的中文输入更容易更快。唯一要注意的是,在诸如拼音法之类的语音法的中文语言中,可能存在与特定的字母数字符号串相匹配的一个以上中文字。如果存在与用来生成中文字的字母数字符号串相匹配的一个以上中文字,则用户可以从与这些符号相匹配的一些字中选择一个字。替代地,系统可以自动为用户选择一个字。用户可以判断自动选出的字是否是正确的字。
图4A示出了根据本发明一个实施例的在搜索站点的搜索框中进行中文输入(或字输入)的处理流程400。在操作401,用户通过点击输入语言选择按钮来选择输入一个或多个中文字。用户的选择通过信号(例如,通过推按计算设备上的键而触发的电信号)被搜索站点感测到。如上所述,输入语言按钮允许用户选择输入语言。例如,语言选择可以包括英文和中文。替代地,语言选择可以有两种以上的语言。三种或更多类型的语言可以被包括。如果中文语言被选择,则组合式(或一体式)中文输入法将被使用。
在操作402,用户键入第一个字母数字符号,其是用来基于特定中文输入法(组合式中文输入法中包括的方法之一)形成中文字的字母数字符号串的一部分。搜索站点接收指示用户键入的第一个字母数字符号的信号。基于所键入的字母数字符号,系统过滤掉不是以所键入的字母数字符号开始的中文字。在操作403,系统显示组合式中文输入法中的中文输入法的与第一个字母数字符号相匹配的中文字。中文输入法的数目和类型可以由网站确定用于所有用户或者可以针对个体用户进行个性化。在操作404,用户键入另一字母数字符号。在操作405,系统向用户显示不同输入法的与所输入的符号相匹配的中文字。如果用户发现相匹配的中文字,则用户可以点击该字来选择它。在操作406,系统判断用户是否输入了指示对所显示字中的一个字的选择的信号。如果答案为“是”(即,用户已从输入法之一选择了中文字),则处理流程400前进到下一操作408。否则,处理流程返回操作404,在其中用户输入另一字母数字符号来细化字的匹配。在一个实施例中,如果用户在用户仅输入了第一个英文字母之后就找到了相匹配字,则操作404和405可被跳过。
可选地,在操作406与408之间,具有操作407,在其中用户选择的字和输入法被搜索系统记录。这样的记录将有助于搜索系统提供中文输入的个性化,如上面讨论的。在操作408,系统判断用户是否结束使用中文输入法。如果用户已结束使用中文输入法,则用户可以推按搜索页面上的搜索按钮(例如,图2C-图2I的搜索按钮212)来开始搜索。替代地,用户可以进行切换以在搜索框中输入一个或多个英文单词。另外,用户可以完全跳过搜索并且决定访问另一网页或网站。如果操作408中的答案为“是”,则中文输入法的使用被完成并且流程处理结束。否则,处理流程返回操作402以输入另一中文字。用户可以输入一串字母数字符号来输入另一中文字。如上面讨论的,用户可以在搜索框中输入混合有中文和英文的中文字(或词语)串或词语串。
如上所述,与用户键入的字母数字符号串相匹配的所显示中文字可以按照基于用户的中文输入历史的顺序来显示。组合式中文输入法可以包括两种、三种、四种或更多种中文输入法。相匹配中文字被显示在具有从最喜爱输入法到最不喜爱输入法的顺序的可用输入法下面。
如上面提到的,这样的组合式中文输入法可用于在用户计算机上的文档(例如Microsoft WORDTM文档)或窗体中,或者在网站上的诸如搜索框或输入窗体之类的窗体(或输入框)中输入中文字。与处理流程400类似的处理流程可被用来描述在窗体中输入中文字所涉及的操作。如果文档驻留在用户计算机上,则用于组合式中文输入法的程序可以驻留在用户的计算机上。在一个实施例中,用户的计算机也记录用户的字选择历史以及用于所选字的中文输入法,以在用户的计算机上个性化用户的中文输入。在上面讨论的示例中,用户输入的符号是字母数字。替代地,用户输入的符号不一定是字母数字。用户可以按压键盘上的字母数字键,但是出现在屏幕上的与字母数字串相对应的字可以是其它类型的符号。
图4B示出了根据本申请一个实施例的用户使用个性化的组合式中文输入法的处理流程450。在可选操作451中,网站标识用户。该操作仅当用户正与网站交互以对搜索框或窗体进行输入时才需要。如果用户正在用户计算机上的文档中工作,则该操作是不需要的。在操作452,用户选择中文作为输入语言。在一个实施例中,用户点击计算机屏幕上的语言选择按钮。如果用户正对web窗体进行输入,则该按钮还可以在网站上。该中文输入法是包括多于一种中文输入法的组合式方法。如果用户正在网站的窗体上输入一个或多个中文字,则可选操作453产生。在操作453,通过分析用户的中文输入历史来标识优选中文输入法。如果用户正在文档中工作,则用户的中文输入历史可被存储在用户的计算机上。替代地,如果用户正在网站上的搜索框或窗体中输入中文字,则用户的中文输入历史可被存储在网站上。如果用户从未使用过组合式中文输入法或者未经常使用该方法或者未使用该方法很久了,则系统可选择包括多种中文输入法的默认组合式中文输入法。替代地,系统可以允许用户指定优选输入法并且将该信息存储在系统中。在操作454,用户键入第一个字母数字符号,该第一个字母数字符号属于被用来通过组合式中文输入法所包括的中文输入法之一来标识中文字的字母数字符号串。用户的输入被用户计算机或网站的系统接收。在操作455,系统针对在操作453中所标识的每种中文输入法来标识与用户输入的第一个字母数字符号相匹配的中文字。在操作456,计算机系统对所选择的每种中文输入法的相匹配中文字进行排序,以将最频繁或最近输入的中文字置于每种方法的顶部并且将最不频繁输入的中文字置于每种方法的底部。在一个实施例中,相匹配中文字的排序是基于用户的中文输入历史的。比起其它字,用户更频繁地输入一些中文字。大多数用户具有他们熟悉的并且经常重复使用它们的中文字列表。本实施例在具有充足的用户中文输入历史时会更好的起作用。在另一实施例中,排序是基于存储有许多用户最频繁输入的中文字的数据库的。如果用户在用户的个人计算机上的文档、电子数据表或窗体等中输入中文字,则该数据库可以驻留在用户计算机上。当用户安装用于组合式中文输入法的软件时该数据库可被下载到用户的计算机上,或者作为该软件的一部分。替代地,该数据库可以驻留在用户正在其上输入字的网站上。网站可以收集使用中文输入法来输入中文字的许多用户(例如,所有用户)的中文字输入历史。
在操作457,计算系统以首先是用户最优选的方法,然后是不太优选的一种或多种方法的方式,来显示每种输入法的相匹配中文字。此外,对于每种方法,最频繁或最近输入的中文字被显示在列表的顶部,然后是不太频繁或不是最近输入的中文字。处理流程可以继续运行用户输入用于形成中文字的字母数字符号串中的另外的符号。此外,处理流程可以继续允许用户输入其他字母数字符号串以便输入另外的中文字。
将一些中文输入法组合在一个显示中并且还具有个性化能力的上述组合式中文输入法的软件程序可以被存储在搜索站点(或搜索站点的服务器)上或者用户的计算设备上。将这样的软件程序存储在网站上对于诸如蜂窝电话之类的移动设备的用户是特别有益的。移动设备通常具有有限的存储和计算能力。组合式中文输入法的软件程序可能占据很大的存储空间和处理资源。对于移动设备用户来说,非常希望将软件程序和用户信息存储在网站上而不是移动设备上。
组合式中文输入法和中文输入的个性化可以适用于对网站上的窗体的输入。它们还可以适用于诸如Microsoft WORDTM、ExcelTM或其它类型中文输入软件之类的文档和窗体中的中文输入。
上述用于个性化的组合式中文输入法的系统和方法使得用户能够在输入中文字时不用标识输入法。系统和方法使能快速字检索并增强用户体验。它们可适用于具有多于一种输入法的其它语言。其它语言也可以从使用户从繁琐的切换中解脱的组合式输入法受益。此外,输入法的个性化还可以提升想要输入其它语言的字的用户的用户体验。
本发明的实施例描述了用于利用组合式(或一体式)中文输入法在计算机或网站上的文档和窗体中输入中文字的系统和方法。该组合式中文输入法包括用户频繁使用的多个中文输入法。与用户键入的符号串相匹配的中文字自动地被生成并被显示在每种中文输入法的下面,供用户选择所希望中文输入法下面的正确字。组合式中文输入法允许用户写入(或输入)中文字而不用指定所使用的中文输入法,这减少了切换输入法所用的时间。此外,组合式中文输入法还可以被个性化以包括用户频繁使用的或指定的中文输入法。与被输入来形成中文字的符号串相匹配的中文字的显示也可被个性化,以增强可用性并且提高标识出相匹配中文字的速度。
考虑到以上实施例,应当明白,本发明可以采用涉及存储在计算机系统中的数据的各种计算机实现的操作。这些操作是需要对物理量进行物理操纵的那些操作。通常,虽然不是必要的,这些量采取能够被存储、传送、组合、比较以及以其它方式被操纵的电信号或磁信号的形式。此外,所执行的操纵在术语方面常常是指例如产生、标识、确定或比较。
本发明还可被实现为计算机可读介质上的计算机可读代码。计算机可读介质是可以存储数据(其随后可被计算机系统读取)的任何数据存储设备。计算机可读介质还可以包括包含计算机代码的电磁载波。计算机可读介质的示例包括硬盘、网络附接存储装置(NAS)、只读存储器、随机存取存储器、CD-ROM、CD-R、CD-RW、磁带以及其它光学和非光学数据存储设备。计算机可读介质还可通过与计算机系统耦接的网络被分发,以使得计算机可读代码以分布式方式被存储并被运行。
这里描述的形成本发明一部分的任何操作都是有用的机器操作。本发明还涉及用于执行这些操作的设备或装置。可以针对所需目的来特别构建该装置,或者其可以是由存储在计算机中的计算机程序选择性地激活或配置的通用计算机。具体地,各种通用机器可用于根据这里的教导编写的计算机程序,或者构建用于执行所需操作的更专用装置可能更方便。
上述方法可以利用其它计算机系统配置来实施,这些计算机系统配置包括手持设备、微处理器系统、基于微处理器或可编程客户电子设备、迷你计算机、主机计算机等。虽然出于清楚理解的目的在一些细节方面描述了前面的发明,然而将清楚,可以在所附权利要求的范围内进行某些改变和修改。因此,本实施例将被认为是说明性的而非限制性的,但是可在所附权利要求的范围和等同物内进行修改。在权利要求中,元件和/或步骤没有隐含任何特定的操作顺序,除非在权利要求中明确指明。
Claims (16)
1.一种实现中文输入方法的电子设备,包括:
用于接收来自用户的使用组合式中文输入法的请求的装置,所述组合式中文输入法包括多种中文输入法;
用于接收用户顺序键入的第一符号串的装置,其中,所述第一符号串被用来输入第一中文字;
用于在表格中显示所述多种中文输入法的与所述第一符号串相匹配的中文字的装置,其中,所述表格的每个列显示了根据所述多种中文输入法中的一种中文输入法用于所述第一中文字的选项;以及
用于接收指示所显示中文字中的一个被选作所述第一中文字的信号的装置。
2.如权利要求1所述的电子设备,其中,与用户顺序键入的所述第一符号串不匹配的中文字被过滤掉。
3.如权利要求1所述的电子设备,其中,所述第一符号串是通过所述多种中文输入法之一形成中文字的整个符号串的一部分。
4.如权利要求1所述的电子设备,还包括
用于接收用户顺序键入的第二符号串的装置,其中,所述第一符号串被用来输入第二中文字;
用于显示所述多种中文输入法的与所述第二符号串相匹配的中文字的装置;
用于接收指示所显示中文字中的一个另外被选作所述第二中文字的另一信号的装置。
5.如权利要求1所述的电子设备,其中,所述多种中文输入法是从包括如下方法的列表中选出的:拼音法、注音法、广东话法、仓颉法、简易仓颉法、CKC法、呒虾米法、大易法、行列法、四角法、Q9法、子来法以及郑码法。
6.如权利要求1所述的电子设备,其中,所述符号是字母数字。
7.如权利要求1所述的电子设备,还包括:
用于下述操作的装置:在接收到来自用户的使用组合式中文输入法的请求之后,标识所述用户以及所述用户的中文输入历史。
8.如权利要求6所述的电子设备,其中,所述多种中文输入法的与所述第一符号串相匹配的中文字按照以下顺序被显示:用户最频繁使用的中文输入法被显示在第一位置处,并且用户最不频繁使用的中文输入法被显示在最后位置处。
9.如权利要求8所述的电子设备,其中,相匹配中文字按如下顺序被显示在所述多种中文输入法中的每种中文输入法下面:用户最频繁使用或最近使用的中文字被显示在列表的顶部,并且用户最不频繁使用或者不是最近使用的中文字被显示在列表的底部。
10.如权利要求1所述的电子设备,还包括:
记录装置,用于记录对所显示中文字中的一个的选择。
11.如权利要求10所述的电子设备,其中,所述记录装置记录所选第一中文字以及与该所选第一中文字相关联的中文输入法。
12.如权利要求1所述的电子设备,其中,所述组合式中文输入法允许用户在无需指定中文输入法的情况下输入中文字。
13.一种在电子设备中实现个性化的中文输入方法的设备,包括:
用于接收来自用户的使用组合式中文输入法的请求的装置;
用于下述操作的装置:在接收到来自用户的使用组合式中文输入法的请求之后,标识所述用户以及所述用户的中文输入历史;
用于下述操作的装置:基于所述用户的中文输入历史来标识所述用户使用过的多种中文输入法以及所述多种中文输入法的从最频繁使用的方法到最不频繁使用的方法的顺序,其中,所述多种中文输入法是所述组合式中文输入法的一部分;
用于接收所述用户输入的第一符号串的装置,其中,所述第一符号串被用来输入第一中文字;
用于下述操作的装置:针对所述多种中文输入法中的每种,标识与所述用户输入的第一符号串相匹配的中文字;
用于下述操作的装置:针对所述多种中文输入法中的每种,按照从最频繁或最近输入的字到最不频繁或不是最近输入的字的顺序来对所标识中文字排序;
用于下述操作的装置:显示所包括的所述多种中文输入法的、与用户输入的所述第一符号串相匹配的中文字,其中经排序的相匹配中文字被显示在所述多种中文输入法中的每种的下面,并且其中所述多种中文输入法按照从最频繁使用的方法到最不频繁使用的方法被显示;
用于下述操作的装置:接收指示所显示中文字中的一个被选作所述第一中文字的信号;以及
用于在显示屏上显示所选第一中文字的装置。
14.如权利要求13所述的设备,还包括
用于接收用户顺序键入的第二符号串的装置,其中,所述第二符号串被用来输入第二中文字;
用于下述操作的装置:针对所述多种中文输入法中的每种,标识与用户输入的所述第二符号串相匹配的中文字;
用于下述操作的装置:针对所述多种中文输入法中的每种,按照从最频繁输入的字到最不频繁输入的字的顺序来对与所述第二符号串相匹配的所标识中文字排序;
用于下述操作的装置:显示所包括的所述多种中文输入法的、与用户输入的所述第二符号串相匹配的中文字,其中,经排序的相匹配中文字被显示在所述多种中文输入法的每种的下面,并且其中,所述多种中文输入法按照从最频繁使用的方法到最不频繁使用的方法被显示;以及
用于下述操作的装置:接收指示所显示中文字中的一个另外被选作所述第二中文字的另一信号。
15.如权利要求13所述的设备,还包括:
用于在所述第一中文字之后输入英文单词的装置,其中,在输入所述英文单词之前,所述组合式中文输入法需要被切换为英文输入法。
16.如权利要求13所述的设备,其中,所述个性化的中文输入能够在所述用户在个人计算系统或网站上输入文档或窗体时被执行。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US12/479,668 | 2009-06-05 | ||
| US12/479,668 US9104244B2 (en) | 2009-06-05 | 2009-06-05 | All-in-one Chinese character input method |
| PCT/US2010/036751 WO2010141389A2 (en) | 2009-06-05 | 2010-05-28 | All-in-one chinese character input method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| HK1167480A1 HK1167480A1 (zh) | 2012-11-30 |
| HK1167480B true HK1167480B (zh) | 2016-10-28 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN102449579B (zh) | 一体式中文字输入方法 | |
| US7257528B1 (en) | Method and apparatus for Chinese character text input | |
| US9715333B2 (en) | Methods and systems for improved data input, compression, recognition, correction, and translation through frequency-based language analysis | |
| TWI443551B (zh) | 用於輸入方法編輯器之方法及系統,及電腦程式產品 | |
| US8745051B2 (en) | Resource locator suggestions from input character sequence | |
| KR100377432B1 (ko) | 문자/단어 생성 방법 및 이를 이용한 정보통신 서비스 방법 | |
| CN102124459B (zh) | 词典词和短语确定 | |
| CN100555254C (zh) | 用于基于触发序列进行文本输入的高效方法和装置 | |
| US20070156394A1 (en) | Method of data entry for indic languages | |
| JP2007133884A5 (zh) | ||
| CN103026318A (zh) | 输入法编辑器 | |
| KR100891358B1 (ko) | 사용자의 다음 문자열 입력을 예측하는 글자 입력 시스템및 그 글자 입력 방법 | |
| JP6180470B2 (ja) | 文章候補提示端末、文章候補提示システム、文章候補提示方法、及びプログラム | |
| CN101211245A (zh) | 文字输入装置 | |
| CN101813981A (zh) | 中文输入装置 | |
| US9563282B2 (en) | Brahmi phonemics based keyboard for providing textual inputs in indian languages | |
| WO2000043861A1 (en) | Method and apparatus for chinese character text input | |
| JP5271526B2 (ja) | 商標検索システム及び商標検索サーバ | |
| JP2002207728A (ja) | 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体 | |
| HK1167480B (zh) | 一体式中文字输入方法 | |
| JP5674140B2 (ja) | テキスト入力装置、テキスト入力受付方法及びプログラム | |
| WO2006122361A1 (en) | A personal learning system | |
| JP3608382B2 (ja) | 文章作成装置及び文章作成方法並びに文章作成プログラムを実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体 | |
| KR102556563B1 (ko) | 텍스트 범위에 대한 폰트 갱신 방법 및 디바이스 | |
| JP2008217770A (ja) | 言語データ表示システム、言語データ表示方法、及び言語データ表示プログラム |