[go: up one dir, main page]

JP2008537260A - ユーザ入力の予測変換 - Google Patents

ユーザ入力の予測変換 Download PDF

Info

Publication number
JP2008537260A
JP2008537260A JP2008507675A JP2008507675A JP2008537260A JP 2008537260 A JP2008537260 A JP 2008537260A JP 2008507675 A JP2008507675 A JP 2008507675A JP 2008507675 A JP2008507675 A JP 2008507675A JP 2008537260 A JP2008537260 A JP 2008537260A
Authority
JP
Japan
Prior art keywords
user input
character set
target
target language
promising
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008507675A
Other languages
English (en)
Inventor
アレクサンダー・エム・フランツ
Original Assignee
グーグル・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グーグル・インコーポレーテッド filed Critical グーグル・インコーポレーテッド
Publication of JP2008537260A publication Critical patent/JP2008537260A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Input From Keyboards Or The Like (AREA)

Abstract

ある言語又は文字セットのユーザテキスト入力の別の言語又は文字セットへの予測変換のシステムおよび方法を開示する。この方法は、非ターゲット言語又は非ターゲット文字セットの部分的ユーザ入力を、ターゲット言語又はターゲット文字セットの変換された部分的ユーザ入力に変換する段階と、有望コンプリージョンモジュールに基づいて変換された部分的ユーザ入力の有望な可能な変換されたコンプリージョンを計算する段階とを含む。この変換は、ターゲット言語又はターゲット文字セットへの非ターゲット言語又は非ターゲット文字セットへのマッピングの辞書に基づく。有望コンプリージョンモジュールは、データベースとするか、データベース又はそのサブセットに対して統計的分析を実行することでトレーニングされたモデルとする。ユーザ入力のサブセットは、特定の地理的位置もしくは時間期間から又はユーザ入力から選択する。

Description

本発明は、全般的には、ある言語または文字セットのユーザテキスト入力の別の言語または文字セットへの変換に関する。より具体的には、ある言語または文字セットのユーザテキスト入力の別の言語または文字セットへの予測変換のシステムおよび方法を開示する。
ユーザが、キーボードなどの非ターゲット言語入力デバイスを使用してコンピュータシステムに直接にテキストを入力することは、困難または不可能である可能性がある。たとえば、ユーザが、ローマ文字(Roman)またはアルファベット文字を有する従来のキーボードを使用して、中国語、日本語、および韓国語(CJK)などの非ローマ文字ベース言語でテキストを直接に入力することは、困難である可能性がある。その代わりに、変換エンジンがユーザのアルファベットストリング入力をターゲット言語に変換する、別々の変換ステップが、一般に必要である。1つの例として、中国語テキストを入力する1つの一般的な方法は、音声学的入力、たとえばピンインを使用する。ピンインは、アルファベット文字を使用し、複数音節単語の形でリストされた用語集を有する。次に、ピンインコンバータは、ピンインで書かれたテキストを中国語に変換する。たとえば、ユーザは、キーボード上のローマ文字を使用して、所望の中国語テキスト入力のピンインでの音声学的表現を入力することができる。次に、ピンイン変換エンジンは、そのピンイン入力を中国語テキストに変換することができる。次に、適当な中国語テキストを、アプリケーション、たとえばワードプロセッシングアプリケーションおよび/または検索エンジンに入力することができる。
もう1つの例として、日本語テキストは、ひらがな、かたかな、および漢字を含むさまざまな異なる文字セットを使用して表すことができるが、これらの文字セットのどれもが、ローマアルファベットに基づく通常のASCIIキーボードを使用して簡単には入力されない。日本語テキストを入力する1つの方法は、ローマ字すなわち日本語の音声学的ローマアルファベット表現を使用する。たとえば、ユーザは、日本国徳島市のジャストシステム社の一太郎などのワードプロセッサを使用して、ローマ字テキスト入力をかたかな、ひらがな、および/または漢字に変換することができる。次に、その日本語テキストを、アプリケーション、たとえばワードプロセッシングアプリケーションおよび/または検索エンジンに入力することができる。市販変換エンジンまたは市販変換プログラムのもう1つの例が、さまざまな言語用のMicrosoft社のInput Method Editorである。
しかし、変換プログラムは、一般に、ユーザがテキスト入力の完全な表現を入力することを必要とする。さらに、そのような変換プログラムは、しばしば、一方の音声学的ローマ文字表現と他方のネイティブ言語またはターゲット言語のテキストとの間の1対1対応がないので、ユーザにとって単調で退屈である。そうではなく、ユーザによって入力されるほとんどのローマ文字表現入力は、曖昧である。言い換えると、ほとんどのローマ文字表現ユーザ入力について、変換プログラムによって作られる可能性がある複数のネイティブ言語変換がある。したがって、変換プログラムが、たとえば確率の順番で、別々のウィンドウ内にまたはドロップダウンリスト内に複数の可能な変換をリストする場合がある。次に、変換エンジンおよび/またはユーザは、最もよい変換または正しい変換を選択することができる。明白なとおり、そのような入力方法は、しばしば、少なくとも部分的に曖昧なローマ文字表現ユーザ入力に起因して、ユーザにとって単調で退屈であり、時間がかかるものになる可能性がある。
必要なものは、非ターゲット入力言語または非ターゲット文字セットを使用して入力テキストを入力し、そのユーザ入力をターゲット言語またはターゲット文字セットに変換する、より効率的でユーザフレンドリな方法である。
ある言語または文字セットのユーザテキスト入力の別の言語または文字セットへの予測変換のシステムおよび方法を開示する。本発明を、プロセス、装置、システム、デバイス、方法、あるいは、コンピュータ可読記憶媒体またはプログラム命令が光通信回線もしくは電子通信回線を介して送信されるコンピュータネットワークなどのコンピュータ可読媒体を含む、多数の形で実施できることを了解されたい。本発明の複数の発明的実施形態を、下で説明する。
この方法は、全般的に、非ターゲット言語または非ターゲット文字セットの部分的ユーザ入力を、ターゲット言語またはターゲット文字セットの変換された部分的ユーザ入力に変換する段階と、有望コンプリージョン(completion)モジュールに基づいて、変換された部分的ユーザ入力の有望な可能な変換されたコンプリージョンを計算する段階であって、可能なコンプリージョンはターゲット言語またはターゲット文字セットで表される、段階と、1つまたは複数の可能な有望な可能な変換されたコンプリージョンを出力する段階とを含むことができる。変換する段階は、ターゲット言語またはターゲット文字セットへの非ターゲット言語または非ターゲット文字セットのマッピングの辞書に基づくものとすることができる。有望コンプリージョンモジュールは、ユーザ入力のデータベースまたはそのサブセットとすることができ、あるいは、ユーザ入力のデータベースまたはそのサブセットに対して統計的分析を実行することによってトレーニングされたモデルとすることができる。ユーザ入力のサブセットは、所定の地理的位置もしくは時間期間からおよび/またはユーザもしくは現在のセッションからのユーザ入力から選択することができる。この方法は、複数の有望コンプリージョンモジュールから有望コンプリージョンモジュールを選択する段階をも含むことができる。
もう1つの実施形態で、予測変換システムは、全般的に、非ターゲット言語または非ターゲット文字セットの部分的ユーザ入力からターゲット言語またはターゲット文字セットの変換された部分的ユーザ入力を生成し、有望コンプリージョンモジュールに基づいてターゲット言語またはターゲット文字セットの変換された部分的ユーザ入力の有望な可能なコンプリージョンを計算するように構成された予測変換エンジンと、ターゲット言語またはターゲット文字セットへの非ターゲット言語または非ターゲット文字セットのマッピングの辞書とを含む。この辞書は、予測変換エンジンが、非ターゲット言語または非ターゲット文字セットの部分的ユーザ入力をターゲット言語またはターゲット文字セットの変換された部分的ユーザ入力に変換するのを容易にする。
もう1つの実施形態では、コンピュータシステムと共に使用されるコンピュータプログラム製品は、コンピュータプロセッサ上で実行可能な命令が格納されるコンピュータ可読記憶媒体を含み、この命令は、全般的に、部分的ユーザ入力を受け取る段階であって、部分的ユーザ入力は非ターゲット言語または非ターゲット文字セットで表される、段階と、変換された部分的ユーザ入力を生成するために部分的ユーザ入力をターゲット言語またはターゲット文字セットに変換する段階と、有望コンプリージョンモジュールに基づいて、変換された部分的ユーザ入力の少なくとも1つの有望な可能なコンプリージョンを計算する段階であって、可能なコンプリージョンはターゲット言語またはターゲット文字セットで表される、段階と、少なくとも1つの可能な有望な可能な変換されたコンプリージョンを出力する段階とを含む。
本発明の上記および他の特徴および利点を、次の詳細な説明および本発明の原理を例によって示す添付図面に、より詳細に示す。
本発明は、添付図面と共に次の詳細な説明によってたやすく理解されるが、添付図面では、類似する符号が類似する構造的要素を示す。
ある言語または文字セットのユーザテキスト入力の別の言語または文字セットへの予測変換のシステムおよび方法を開示する。予測変換とは、全体的に、ユーザテキスト入力の予測コンプリージョンと、入力非ターゲット言語または入力非ターゲット文字セットからターゲット言語またはターゲット文字セットへの変換との両方を指す。たとえば、入力非ターゲット言語または入力非ターゲット文字セットのユーザ入力Aを、ターゲット言語またはターゲット文字セットのXに変換し、XYZに予測コンプリートすることができる。代替案では、入力非ターゲット言語または入力非ターゲット文字セットのユーザ入力Aを、ABCに予測コンプリートし、ターゲット言語またはターゲット文字セットのXYZに変換することができる。次の説明は、当業者が本発明を作り、使用することを可能にするために提示される。特定の実施形態および応用例の説明は、例としてのみ提供され、さまざまな変更は、当業者にたやすく明白になる。本明細書で定義される全般的な原理は、本発明の趣旨および範囲から逸脱せずに他の実施形態および応用例に適用することができる。したがって、本発明を、本明細書で開示される原理および特徴と一貫する多数の代替形態、修正形態、および同等物を含む最も広い範囲に一致させなければならない。明瞭にするために、本発明に関連する技術分野で既知の技術的材料に関する詳細は、本発明を不必要に不明瞭にしないようにするために、詳細には説明しない。
ある言語または形のユーザ入力の別の言語または形への予測変換のシステムおよび方法は、ユーザが非ターゲット言語入力方法またはキーボードなどの非ターゲット言語入力デバイスを使用してコンピュータシステムにテキストを入力するのを容易にする。たとえば、予測ユーザ入力変換のシステムおよび方法を、ユーザがローマ文字またはアルファベット文字を有する従来のキーボードを使用して中国語、日本語、および韓国語(CJK)などの非ローマ文字ベースの言語でテキストを入力するのを容易にするために適合させることができる。ユーザは、第1言語または第1文字セット、たとえばピンインまたはローマ字などの音声学的入力で、部分的入力、たとえば単語または文字の部分的表現を入力することができ、予測ユーザ入力変換システムは、この入力を、ターゲット言語またはターゲット文字セット、たとえば中国文字あるいはかたかな、ひらがな、および/または漢字に予測変換し、1つまたは複数の提案される予測変換をユーザに提示することができる。本明細書で提示する例示的な例で説明するように、この予測変換のシステムおよび方法を情報検索システムまたは検索エンジン内で実施して、ユーザのアルファベットストリング検索入力をターゲット言語に予測変換することができる。その後、予測変換されたユーザ入力を使用して、たとえば関連文書に関する検索を実行することができる。しかし、この予測変換のシステムおよび方法を、ワードプロセッシングアプリケーションまたはテキスト入力を必要とする他のアプリケーションなどのさまざまな他の適切なアプリケーションで実施できることを理解されたい。
図1は、予測ユーザ入力変換システムを実施できる例示的な情報検索システム100のブロック図である。システム100には、ネットワーク106を介して複数のサーバ104および105に接続された複数のクライアントデバイス102を含めることができる。クライアントデバイス102には、ユーザ入力を受け入れ、ネットワーク106を介して他のシステム102、104、および105から受信された情報を表示するブラウザ110を含めることができる。サーバ104および105には、ネットワーク106を介して送信されたユーザクエリを受け入れ、文書のデータベースを検索し、結果をユーザに返す検索エンジン112を含めることができる。ネットワーク106には、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)、仮想プライベートネットワーク(VPN)、公衆交換電話網(PSTN)などの電話網、イントラネット、インターネット、またはネットワークの組合せを含めることができる。単に例示のために、図1に示された情報検索システム100は、ネットワーク106を介して接続された3つのクライアントデバイス102とサーバ104および105とを含む。しかし、実際には、より多数またはより少数のクライアントデバイス、サーバ、および/またはネットワークが存在する場合があることと、一部のクライアントデバイスが、サーバの少なくともいくつかの機能をも実行でき、一部のサーバが、クライアントの少なくともいくつかの機能をも実行できることとを了解されたい。
図2は、予測ユーザ入力変換システムを実施する、図1に示されたクライアント102またはサーバ104および105などの例示的なコンピューティングシステムまたはコンピューティングデバイス200のブロック図である。一実施形態で、システム200は、パーソナルコンピュータ、ラップトップ機、メインフレーム、携帯情報端末、セル電話機、および/または類似物などのコンピューティングデバイスを含む。システム200には、通常、プロセッサ202、メモリ204、ユーザインターフェース206、取外し可能記憶媒体208を受け入れる入出力ポート207、ネットワークインターフェース210、および前述の要素を接続するバス212を含めることができる。
システム200の動作は、通常、メモリ204内に記憶されたプログラムの案内の下で動作するプロセッサ202によって制御することができる。メモリ204は、一般に、高速ランダムアクセスメモリ(RAM)と、読取専用メモリ(ROM)、磁気ディスク、ディスクアレイ、および/またはテープアレイなどの不揮発性メモリとなど、コンピュータ可読媒体のある組合せを含む。入出力ポート207には、フロッピディスケット、CD-ROM、DVD、メモリカード、磁気テープ、または類似物などのコンピュータ可読媒体を受け入れるディスクドライブまたはメモリスロットを含めることができる。ユーザインターフェース206には、たとえば、キーボード、マウス、ペン、または情報を入力する音声認識機構と、ユーザに情報を提示する、ディスプレイ、プリンタ、スピーカ、および/または類似物などの1つまたは複数の機構とを含めることができる。ネットワークインターフェース210は、通常、有線接続、無線接続、光接続、および/または他の接続を介するシステム200と他のシステム(および/またはネットワーク220)との間の接続を提供するように動作可能である。
下でより詳細に説明するように、システム200は、ある言語または文字セットのユーザテキスト入力の別の言語または文字セットへの予測変換を実行するように構成することができる。これらの動作は、通常、プロセッサ202がメモリ204などのコンピュータ可読媒体に含まれるソフトウェア命令を実行することに応答して実行することができる。ソフトウェア命令は、データストレージデバイス208などのもう1つのコンピュータ可読媒体から、あるいは通信インターフェース210または入出力ポート207を介して別のデバイスから、メモリ204に読み込むことができる。図2に示されているように、メモリ204には、システム200の動作を制御し、下でより詳細に説明する予測変換およびオプションの検索取り出し技法を実行する、さまざまなプログラムまたはモジュールを含めることができる。たとえば、メモリ204に、予測ユーザ入力変換アプリケーション229、ユーザ入力データベース230、およびターゲット言語へのソース(非ターゲット入力)言語のマッピングの辞書231を含めることができる。ターゲット言語へのソース言語のマッピングの辞書231は、予測変換アプリケーション229が非ターゲット言語または非ターゲット文字セットの部分的ユーザ入力をターゲット言語またはターゲット文字セットに変換するのを容易にする。
システム200が、検索エンジン用のサーバ、たとえば図1に示されたサーバ105である場合に、メモリ204に、さらに、文書データベースおよび対応するインデックス232を含めることができる。文書データベース232は、ウェブコーパスとすることができ、ユーザ入力データベース230は、クエリログとすることができる。メモリ204には、ユーザインターフェース206を介して受け取られたクエリおよび/またはネットワーク220を介してユーザからリモートに受信されたクエリに基づいて文書データベース232を検索するクエリ検索エンジン233をも含めることができる。図2に示されているように、メモリ204には、下で詳細に説明する技法を使用してユーザクエリ入力を予測変換する1つまたは複数のプログラムと、ユーザインターフェース206を動作させ、かつ/またはネットワーク220を介してリモートユーザにウェブページを供給するユーザインターフェースアプリケーション234をも含めることができる。図2には、主にソフトウェアベースのシステムが示されているが、他の実施形態で、特殊目的回路を、ソフトウェア命令の代わりにまたはソフトウェア命令と組み合わせて使用して、本発明と一貫するプロセスを実施できることを了解されたい。したがって、本発明は、ハードウェアおよびソフトウェアのどの特定の組合せにも限定されない。
本発明のシステムおよび方法を、図1および2に示された構成要素の一部を欠き、かつ/または図示されていない他の構成要素を有するデバイスおよび/またはアーキテクチャを用いて実践できることを了解されたい。したがって、図1および2が、例示のために提供されたものであって、本発明の範囲を限定しないことを了解されたい。たとえば、例示のために、システム200が、パーソナルコンピュータまたはネットワークサーバなどの単一の汎用コンピューティングデバイスとして図示されているが、他の実施形態で、システム200に、分散コンピューティング技法を使用して一緒に動作する1つまたは複数のそのようなシステムを含めることができることを了解されたい。そのような実施形態では、図2に示された構成要素機能性の一部またはすべてを、複数の位置にあり、かつ/または複数の当事者によって運営される複数のシステムにまたがって分散させることができる。たとえば、予測ユーザ入力変換アプリケーション229と、それに関連する、ユーザ入力データベース230およびターゲット言語へのソース(入力)言語のマッピングの辞書231を含む構成要素とを、文書データベース232がホスティングされるシステムとは別々のシステムで実施することができる。予測クエリ変換アプリケーション229は、いくつかの実施形態で、サーバではなくクライアント側で実行することができる。本発明の原理から逸脱せずに、多数の類似する変形を、図1および2に示された例に対して作ることができることは、すぐに明白になるであろう。
前に示したように、図1および2に示されたシステムを使用して、部分的ユーザ入力の予測変換を容易にすることができる。図3は、予測ユーザ入力変換システム250を示すブロック図である。この図に示されているように、予測ユーザ入力変換システム250は、ターゲット言語へのソース(非ターゲット)言語のマッピングの辞書231およびユーザ入力データベース230と通信する予測ユーザ入力変換エンジン229を含む。予測ユーザ入力変換エンジン229には、有望コンプリージョンのモジュール235を含めることができる。いくつかの実施形態で、有望コンプリージョンのモジュール235を、ユーザ入力のデータベースまたはそのサブセットとすることができる。もう1つの例で、このモジュールは、たとえばユーザ入力データベース230(たとえば、クエリログ)またはそのサブセットを使用してトレーニングされるモデルとすることができる。有望コンプリージョンモジュール235は、ターゲット言語またはターゲット文字セットの有望なコンプリートされた入力ストリングおよびそれに対応する確率を提供する。
図4は、予測ユーザ入力変換を実行するプロセス260を示す流れ図である。プロセス260は、所与のセッション内の一連のユーザ入力について、たとえば、ターゲット言語またはターゲット文字セットの文字、単語、または句のそれぞれについて繰り返すことができる。ブロック262で、非ターゲット言語または非ターゲット文字セットの少なくとも部分的ユーザ入力、たとえばプレフィックスを受け取る。注記したように、部分的ユーザ入力は、ターゲット言語またはターゲット文字セット、たとえば中国語文字とは異なる第1の非ターゲット言語または非ターゲット文字セット、たとえばローマ文字またはアルファベット文字で表される。次に、予測変換エンジンは、ブロック264および266で、部分的ユーザ入力を使用して予測変換を実行することを試みることができる。具体的に言うと、ブロック264で、第1の非ターゲット言語または非ターゲット文字セットの部分的ユーザ入力を使用して、ターゲット言語またはターゲット文字セットの可能な変換を生成する。たとえば、ターゲット言語またはターゲット文字セットへの第1の非ターゲット言語または非ターゲット文字セットのマッピングの辞書を、ブロック264を実行する際に使用することができる。ブロック266で、部分的ユーザ入力の可能な変換の可能なコンプリージョンを生成する。ブロック266で、予測変換エンジンが、一般に、予測変換の確率に基づいて、コンプリートされた予測をランキングもすることに留意されたい。この確率は、下でより詳細に説明するように、ユーザ入力のデータベース、たとえばクエリログに基づいて決定することができる。具体的に言うと、有望コンプリージョンモジュールを、ブロック266を実行する際に使用することができる。
図示の例では、このプロセスは、まず、ブロック264でターゲット言語またはターゲット文字セットへの部分的ユーザ入力の可能な変換を生成し、次に、ブロック266で、変換された部分的ユーザ入力の可能なコンプリージョンを生成する。ブロック266を、ブロック264の前に実行できることを理解されたい。具体的に言うと、プロセス260は、ブロック266で非ターゲット言語または非ターゲット文字セットの部分的ユーザ入力の可能なコンプリージョンを生成し、ブロック264でその可能なコンプリージョンをターゲット言語またはターゲット文字セットに変換することができる。もう1つの例として、ブロック264および266を、単一の一体化された予測変換プロセスに組み合わせることができる。具体的に言うと、プロセス260は、ターゲット言語またはターゲット文字セットの予測変換への非ターゲット言語または非ターゲット文字セットの部分的ユーザ入力のマッピングを含む一体化された予測変換データ構造または一体化された予測変換データベースを利用することができる。このデータベースには、マッピングに関する頻度または他の統計的情報もしくは他の確率情報をも含めることができる。そのような構成では、ターゲット言語またはターゲット文字セットへの非ターゲット言語または非ターゲット文字セットのマッピングの辞書が、予測変換データベースに一体化されるはずである。
1つまたは複数のパラメータを利用して、ブロック264および266(または上で説明したその変形形態)の動作に影響することができる。たとえば、1つのパラメータが、より長い予測コンプリージョンまたはより短い予測コンプリージョンの好みを示すことができる。各パラメータは、システムまたはプロセスによって自動的にセットし、デフォルト値をセットし、かつ/またはユーザによってセットすることができる。
予測変換エンジンが、いくつかの実施形態で、ユーザが入力を入力する時にブロック262で部分的ユーザ入力の範囲を対話的に監視することができ、その結果、予測変換エンジンが、1つまたは複数の予測変換を生成するのに十分な部分的入力をユーザが入力し終えた時に予測変換を実行できるようになることに留意されたい。たとえば、ユーザ入力がピンインである場合に、ユーザは、予測変換エンジンが予測変換を生成する前に、少なくとも1つの中国語文字のピンインを入力することができる。ユーザ入力が意味のあるおよび/または有用な予測変換を生成するのに十分である時の判定は、たとえば、特定のユーザ入力と、部分的ユーザ入力の可能な変換の確率および/またはその可能な変換の可能なコンプリージョンの確率とに基づくものとすることができる。
次に、ブロック268で、ターゲット言語またはターゲット文字セットの1つまたは複数の予測変換を、ユーザに出力する。一実施形態では、予測変換の確率に基づくトップN(たとえば5)予測変換の組をユーザに出力する。もう1つの実施形態では、最高の確率を有する予測変換だけをユーザに出力する。ユーザに出力される予測変換の個数は、予測変換の確率に基づいて動的に決定することができる。たとえば、予測変換エンジンを、たとえば最も有望な予測変換が、所定の閾値より大きい確率および/または次に有望な予測変換の所定の倍数より大きい確率を有する場合に、最も有望な予測変換だけを出力するように構成することができる。判断ブロック270で、ユーザが、ユーザに出力された予測変換のうちの1つを選択する場合に、選択された予測変換を、ユーザの望みの変換として採用することができ、予測ユーザ入力変換のプロセス260は、完了する。しかし、判断ブロック270の判定で、ユーザがブロック268で出力された予測変換からの選択を行わない場合には、プロセス260は、ブロック272でさらなるユーザ入力の受け取りを継続し、その結果、追加ユーザ入力を、予測変換を実行するために予測ユーザ入力変換エンジンによって使用できるようにする。その後、プロセス260は、ブロック264に戻って、追加ユーザ入力を使用して予測変換を実行する。
上で注記したように、予測変換の確率は、有望コンプリージョンモジュールを使用して、予測変換エンジンによって計算することができる。いくつかの実施形態で、有望コンプリージョンのモジュールを、手動で生成するか、他の形で事前に決定することができる。より通常、有望コンプリージョンモジュールを、ユーザ入力および対応するコンプリートされた変換のデータベースを使用してトレーニングされる有望コンプリージョンモデルとすることができる。有望コンプリージョンのデータベースは、アプリケーションおよび/またはユーザに適当に調整することができる。たとえば、検索エンジンにテキストを入力するユーザについて、予測変換の確率を、全ユーザのクエリログ、あるいは、同一のもしくは類似する地理的位置および/または同一のもしくは類似する時間期間のユーザに関するクエリログを使用して計算することができる。もう1つの例として、予測変換エンジンを、ユーザ自身の入力または検索、たとえば、ユーザの現在の検索セッションまたはユーザの過去の検索セッションだけを使用することによって、パーソナライズすることができる。
図5は、予測ユーザ入力コンバータの有望コンプリージョンのモジュールを生成する例示的なプロセス280を示す流れ図である。ブロック282で、ターゲット言語またはターゲット文字セットのユーザ入力のログを、ユーザ入力データベースを構築するために維持することができる。注記したように、ユーザ入力データベースは、検索エンジンに関連するクエリログまたは検索ログとすることができる。このデータベースは、予測されたコンプリートされた変換の尤度を判定するのを容易にする。ブロック284で、ユーザデータベースまたはそのサブセットを使用して、有望コンプリージョンモジュールを生成することができる。具体的に言うと、特定の特性を有するモジュールを生成するために、たとえば、アプリケーションおよび/またはユーザに適当にモジュールを調整するために、ユーザデータベースのサブセットを選択することができる。たとえば、ユーザデータベースのサブセットを、特定の時間期間から収集された入力、特定の地理的位置のユーザから収集された入力、同一ユーザから収集された入力、特定のセッション内で同一ユーザから収集された入力、および/またはさまざまな他の適切な判断基準に基づいて選択することができる。ブロック286で、ブロック284で選択されたデータベースまたはそのサブセットに対して統計的分析を実行することによって、有望入力ストリングおよび有望コンプリージョン(たとえば、検索)のモジュールを生成する。有望コンプリージョンモジュールをトレーニングするプロセスは、データベースが更新される時に周期的に実行することができ、かつ/あるいは、アプリケーションおよび/またはユーザに適当に各モデルを調整するためにさまざまなモデルを生成するために繰り返すことができる。
注記したように、予測変換エンジンを、検索エンジンに一体化することができる。この一体化は、さまざまな形で達成することができる。たとえば、予測変換エンジンを、検索エンジンサーバの一部として実施することができ、その結果、ユーザは、プレフィックスまたは他の部分的クエリをたとえばローマ文字表現で入力するだけになり、サーバが、その部分的クエリをターゲット言語またはターゲット文字セットに変換し、変換の1つまたは複数の有望なコンプリージョンを生成する(あるいは、上で注記したように、部分的クエリの有望なコンプリージョンを生成し、その有望なコンプリージョンをターゲット言語またはターゲット文字セットに変換する)ようになる。次に、サーバは、最も有望なコンプリートされた変換のリスト、たとえば5個または10個の最も有望なコンプリートされた変換のリストを返すことができ、ユーザは、このリストから検索を実行することを選択することができる。その代わりにまたはそれに加えて、サーバは、最も有望なコンプリートされた変換に基づいて検索を実行し、検索結果をユーザに返すことができる。
サーバ側で予測変換エンジンを提供する代わりに、予測変換エンジンを、同様に、クライアント側のユーザのクライアントプログラム内で、たとえば、ウェブブラウザなどのインターフェースアプリケーション用のツールバー内で実施することができる。そのような構成では、ユーザは、ローマ文字のクエリなど、部分的入力の入力を開始することができ、クライアント側予測変換エンジンは、ユーザの入力を監視し、ユーザが十分な量の情報を供給した時に1つまたは複数の可能なコンプリートされた変換を予測計算することができる。代替案では、ユーザは、入力を入力し、手動でまたは他の形で予測変換エンジンに1つまたは複数の可能なコンプリートされた変換を予測計算させることができる。出力は、たとえば、ポップアップウィンドウ内またはドロップダウンリスト内で供給することができ、そこから、ユーザは、可能なコンプリートされた変換のうちの1つを選択することができる。
明白なとおり、予測変換エンジンまたは予測変換システムは、サーバ側またはクライアント側のどちらにインストールされる場合であっても、ユーザが非ターゲット言語で所望の入力の部分的表現だけを入力することを可能にすることによって、ユーザ入力を容易にする。言い換えると、ユーザは、所望の入力の始めのシーケンス、プレフィックス、または他の部分的表現を非ターゲット言語で入力するだけでよく、予測変換システムが、ターゲット言語への変換ならびに変換された部分的入力の予測コンプリージョンを実行する。
本発明の例示的実施形態を、本明細書で説明し、図示したが、これらが、単に例示的であることと、本発明の趣旨および範囲から逸脱せずに、これらの実施形態に対して変更を行えることを了解されたい。したがって、本発明の範囲は、修正される可能性がある添付の特許請求の範囲に関してのみ定義されることが意図されており、各請求項は、本発明の実施形態としてこの「発明を実施するための最良の形態」に明示的に組み込まれている。
予測ユーザ入力変換システムを実施できる例示的な情報検索システムを示すブロック図である。 例示的な予測ユーザ入力変換システムを実施する、図1に示されたクライアントまたはサーバなどの例示的なコンピューティングシステムまたはコンピューティングデバイスを示すブロック図である。 例示的な予測ユーザ入力変換システムをより詳細に示すブロック図である。 予測ユーザ入力変換を実行する例示的プロセスを示す流れ図である。 予測ユーザ入力コンバータの有望コンプリージョンモジュールをトレーニングする例示的プロセスを示す流れ図である。
符号の説明
100 情報検索システム
102 クライアントデバイス
104 サーバ
105 サーバ
106 ネットワーク
110 ブラウザ
112 検索エンジン
200 コンピューティングシステムまたはコンピューティングデバイス
202 プロセッサ
204 メモリ
206 ユーザインターフェース
207 入出力ポート
208 取外し可能記憶媒体
210 ネットワークインターフェース
212 バス
220 ネットワーク
229 予測ユーザ入力変換アプリケーション
230 ユーザ入力データベース
231 ターゲット言語へのソース言語のマッピングの辞書
232 文書データベースおよび対応するインデックス
233 クエリ検索エンジン
234 ユーザインターフェースアプリケーション
235 有望コンプリージョンのモジュール
250 予測ユーザ入力変換システム
260 プロセス
262 少なくとも部分的ユーザ入力を受け取るブロック
264 部分的ユーザ入力の可能な変換を生成するブロック
266 部分的ユーザ入力の可能な変換から可能な予測コンプリージョンを生成するブロック
268 たとえばトップ5の、予測変換をユーザに出力するブロック
270 ユーザが予測変換のうちの1つを選択するかどうかを判定するブロック
272 ユーザ入力の受け取りを継続するブロック
280 プロセス
282 ユーザ入力データベースを構築するために、ユーザ入力およびユーザによって選択された対応する予測変換を受け取るブロック
284 有望コンプリージョンのモデルをトレーニングするために、ユーザ入力データベースのすべてまたはサブセットを選択するブロック
286 変換された部分的ユーザ入力の最も有望なコンプリージョンを判定するために、データベースまたはそのサブセットに対して統計的分析を実行するブロック

Claims (32)

  1. 部分的ユーザ入力を予測変換する方法であって、
    前記部分的ユーザ入力をユーザから受け取る段階であって、前記部分的ユーザ入力は、非ターゲット言語または非ターゲット文字セットで表される、段階と、
    前記部分的ユーザ入力の少なくとも1つの可能な変換されたコンプリージョンを生成するために、有望コンプリージョンモジュールに基づいて前記部分的ユーザ入力の予測変換を実行する段階であって、前記少なくとも1つの可能な変換されたコンプリージョンは、ターゲット言語またはターゲット文字セットで表される、段階と、
    前記少なくとも1つの可能な変換されたコンプリージョンのうちの1つまたは複数を出力する段階と
    を含む方法。
  2. 前記実行する段階は、
    変換された部分的ユーザ入力を生成するために、前記部分的ユーザ入力を前記ターゲット言語または前記ターゲット文字セットに変換する段階と、
    前記有望コンプリージョンモジュールに基づいて前記変換された部分的ユーザ入力の前記少なくとも1つの可能な変換されたコンプリージョンを計算する段階と
    を含む、請求項1に記載の方法。
  3. 前記実行する段階は、
    前記有望コンプリージョンモジュールに基づいて前記非ターゲット言語または非ターゲット文字セットの少なくとも1つの可能な部分的ユーザ入力コンプリージョンを計算する段階であって、前記有望コンプリージョンモジュールは、前記非ターゲット言語または非ターゲット文字セットで表される、段階と、
    前記少なくとも1つの可能な変換されたコンプリージョンを生成するために、前記少なくとも1つの可能な部分的ユーザ入力コンプリージョンを前記ターゲット言語または前記ターゲット文字セットに変換する段階と
    を含む、請求項1に記載の方法。
  4. 前記実行する段階は、さらに、ターゲット言語またはターゲット文字セットへの非ターゲット言語または非ターゲット文字セットのマッピングの辞書に基づく、請求項1に記載の方法。
  5. ユーザ入力のデータベースに基づいて前記有望コンプリージョンモジュールをトレーニングする段階
    をさらに含む、請求項1に記載の方法。
  6. 前記データベース内の前記ユーザ入力は、前記ターゲット言語または前記ターゲット文字セットと前記非ターゲット言語または前記非ターゲット文字セットとのうちの1つで表される、請求項5に記載の方法。
  7. 前記トレーニングする段階は、前記部分的ユーザ入力の有望なコンプリージョンを判定するために、前記データベース内の前記ユーザ入力の少なくとも一部に対して統計的分析を実行する段階を含む、請求項5に記載の方法。
  8. 前記トレーニングする段階は、前記データベース内の前記ユーザ入力のサブセットに基づき、前記ユーザ入力の前記サブセットは、地理的位置、時間期間、および前記部分的ユーザ入力がそのユーザから受け取られた前記ユーザのうちの少なくとも1つに関連する、請求項5に記載の方法。
  9. 複数の有望コンプリージョンモジュールから前記有望コンプリージョンモジュールを選択する段階
    をさらに含む、請求項1に記載の方法。
  10. 前記部分的ユーザ入力は、検索エンジンへの部分的ユーザクエリである、請求項1に記載の方法。
  11. 前記可能な変換されたコンプリージョンの確率に基づいて可能な変換されたコンプリージョンのサブセットを選択する段階であって、前記出力する段階は、前記可能な変換されたコンプリージョンの前記サブセットを出力する、段階
    をさらに含む、請求項1に記載の方法。
  12. 部分的ユーザ入力の少なくとも1つの可能な変換されたコンプリージョンを生成するために、有望コンプリージョンモジュールに基づいて、非ターゲット言語または非ターゲット文字セットの前記部分的ユーザ入力の予測変換を実行するように構成された予測変換エンジンであって、前記少なくとも1つの可能な変換されたコンプリージョンは、ターゲット言語またはターゲット文字セットで表される、予測変換エンジンと、
    前記予測変換エンジンが前記非ターゲット言語または前記非ターゲット文字セットから前記ターゲット言語または前記ターゲット文字セットに変換するのを容易にするための、ターゲット言語またはターゲット文字セットへの非ターゲット言語または非ターゲット文字セットのマッピングの辞書と
    を含む予測変換システム。
  13. 前記予測変換エンジンは、前記非ターゲット言語または前記非ターゲット文字セットの前記部分的ユーザ入力から前記ターゲット言語または前記ターゲット文字セットの変換された部分的ユーザ入力を前記辞書に基づいて生成するようにさらに構成される、請求項12に記載のシステム。
  14. 前記予測変換エンジンは、前記有望コンプリージョンモジュールに基づいて前記非ターゲット言語または前記非ターゲット文字セットの少なくとも1つの可能な部分的ユーザ入力コンプリージョンを計算するようにさらに構成され、前記有望コンプリージョンモジュールは、前記非ターゲット言語または前記非ターゲット文字セットで表され、前記予測変換エンジンは、前記少なくとも1つの可能な変換されたコンプリージョンを生成するために、前記辞書に基づいて、前記少なくとも1つの可能な部分的ユーザ入力コンプリージョンを前記ターゲット言語または前記ターゲット言語セットに変換するようにさらに構成される、請求項12に記載のシステム。
  15. ユーザ入力のデータベースに基づいて前記有望コンプリージョンモジュールをトレーニングするように構成されたトレーニングエンジン
    をさらに含む、請求項12に記載のシステム。
  16. 前記データベース内の前記ユーザ入力は、前記ターゲット言語または前記ターゲット文字セットと前記非ターゲット言語または前記非ターゲット文字セットとのうちの1つで表される、請求項15に記載のシステム。
  17. 前記トレーニングエンジンは、前記部分的ユーザ入力の有望なコンプリージョンを判定するために、前記データベース内の前記ユーザ入力の少なくとも一部に対して統計的分析を実行するようにさらに構成される、請求項15に記載のシステム。
  18. 前記トレーニングエンジンは、前記データベース内の前記ユーザ入力のサブセットに基づいて前記有望コンプリージョンモジュールをトレーニングするようにさらに構成され、前記ユーザ入力の前記サブセットは、地理的位置、時間期間、およびユーザのうちの1つまたは複数に関連する、請求項15に記載のシステム。
  19. 前記予測変換エンジンは、複数の有望コンプリージョンモジュールから前記有望コンプリージョンモジュールを選択するようにさらに構成される、請求項12に記載のシステム。
  20. 前記部分的ユーザ入力は、検索エンジンへの部分的ユーザクエリである、請求項12に記載のシステム。
  21. 前記予測変換エンジンは、前記可能な変換されたコンプリージョンの確率に基づいて可能な変換されたコンプリージョンのサブセットを出力として選択するようにさらに構成される、請求項12に記載のシステム。
  22. コンピュータシステムと共に使用されるコンピュータプログラム製品であって、前記コンピュータプログラム製品は、コンピュータプロセッサ上で実行可能な命令が格納されるコンピュータ可読記憶媒体を含み、前記命令は、
    部分的ユーザ入力を受け取る段階であって、前記部分的ユーザ入力は、非ターゲット言語または非ターゲット文字セットで表される、段階と、
    前記部分的ユーザ入力の少なくとも1つの可能な変換されたコンプリージョンを生成するために、有望コンプリージョンモジュールに基づいて前記部分的ユーザ入力の予測変換を実行する段階であって、前記少なくとも1つの可能な変換されたコンプリージョンは、ターゲット言語またはターゲット文字セットで表される、段階と、
    前記少なくとも1つの可能な変換されたコンプリージョンのうちの1つまたは複数を出力する段階と
    を含む、コンピュータプログラム製品。
  23. 前記実行する段階は、変換された部分的ユーザ入力を生成するために、前記部分的ユーザ入力を前記ターゲット言語または前記ターゲット文字セットに変換する段階と、前記有望コンプリージョンモジュールに基づいて前記変換された部分的ユーザ入力の前記少なくとも1つの可能な変換されたコンプリージョンを計算する段階とを含む、請求項22に記載のコンピュータプログラム製品。
  24. 前記実行する段階は、前記有望コンプリージョンモジュールに基づいて前記非ターゲット言語または非ターゲット文字セットの少なくとも1つの可能な部分的ユーザ入力コンプリージョンを計算する段階であって、前記有望コンプリージョンモジュールは、前記非ターゲット言語または非ターゲット文字セットで表される、段階と、前記少なくとも1つの可能な変換されたコンプリージョンを生成するために、前記少なくとも1つの可能な部分的ユーザ入力コンプリージョンを前記ターゲット言語または前記ターゲット文字セットに変換する段階とを含む、請求項22に記載のコンピュータプログラム製品。
  25. 前記実行する段階は、さらに、ターゲット言語またはターゲット文字セットへの非ターゲット言語または非ターゲット文字セットのマッピングの辞書に基づく、請求項22に記載のコンピュータプログラム製品。
  26. 前記命令は、
    ユーザ入力のデータベースに基づいて前記有望コンプリージョンモジュールをトレーニングする段階
    をさらに含む、請求項22に記載のコンピュータプログラム製品。
  27. 前記データベース内の前記ユーザ入力は、前記ターゲット言語または前記ターゲット文字セットと前記非ターゲット言語または前記非ターゲット文字セットとのうちの1つで表される、請求項26に記載のコンピュータプログラム製品。
  28. 前記トレーニングする段階は、変換された部分的ユーザ入力の有望なコンプリージョンを判定するために、前記データベース内の前記ユーザ入力の少なくとも一部に対して統計的分析を実行する段階を含む、請求項26に記載のコンピュータプログラム製品。
  29. 前記トレーニングする段階は、前記データベース内の前記ユーザ入力のサブセットに基づき、ユーザ入力の前記サブセットは、地理的位置、時間期間、および前記部分的ユーザ入力がそのユーザから受け取られた前記ユーザのうちの少なくとも1つに関連する、請求項26に記載のコンピュータプログラム製品。
  30. 前記命令は、
    複数の有望コンプリージョンモジュールから前記有望コンプリージョンモジュールを選択する段階
    をさらに含む、請求項22に記載のコンピュータプログラム製品。
  31. 前記部分的ユーザ入力は、検索エンジンへの部分的ユーザクエリである、請求項22に記載のコンピュータプログラム製品。
  32. 前記命令は、
    前記可能な変換されたコンプリージョンの確率に基づいて可能な変換されたコンプリージョンのサブセットを選択する段階であって、前記出力する段階は、前記可能な変換されたコンプリージョンの前記サブセットを出力する、段階
    をさらに含む、請求項22に記載のコンピュータプログラム製品。
JP2008507675A 2005-04-21 2006-03-22 ユーザ入力の予測変換 Pending JP2008537260A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/111,583 US7506254B2 (en) 2005-04-21 2005-04-21 Predictive conversion of user input
PCT/US2006/010355 WO2006115642A1 (en) 2005-04-21 2006-03-22 Predictive conversion of user input

Publications (1)

Publication Number Publication Date
JP2008537260A true JP2008537260A (ja) 2008-09-11

Family

ID=36829761

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008507675A Pending JP2008537260A (ja) 2005-04-21 2006-03-22 ユーザ入力の予測変換

Country Status (5)

Country Link
US (1) US7506254B2 (ja)
JP (1) JP2008537260A (ja)
KR (1) KR101249663B1 (ja)
CN (1) CN101203849B (ja)
WO (1) WO2006115642A1 (ja)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8972444B2 (en) 2004-06-25 2015-03-03 Google Inc. Nonstandard locality-based text entry
US8392453B2 (en) * 2004-06-25 2013-03-05 Google Inc. Nonstandard text entry
US7840399B2 (en) * 2005-04-07 2010-11-23 Nokia Corporation Method, device, and computer program product for multi-lingual speech recognition
US8904282B2 (en) * 2005-04-21 2014-12-02 Motorola Mobility Llc Electronic device having capability for interpreting user inputs and method therefor
US10735576B1 (en) * 2005-07-14 2020-08-04 Binj Laboratories, Inc. Systems and methods for detecting and controlling transmission devices
US7831913B2 (en) * 2005-07-29 2010-11-09 Microsoft Corporation Selection-based item tagging
US7861164B2 (en) * 2005-11-03 2010-12-28 Bin Qin Method to sequentially encode PINYIN of Chinese character with few symbols
JP2007193438A (ja) * 2006-01-17 2007-08-02 Casio Comput Co Ltd 電子辞書装置及び検索制御プログラム
US8762358B2 (en) * 2006-04-19 2014-06-24 Google Inc. Query language determination using query terms and interface language
US8442965B2 (en) 2006-04-19 2013-05-14 Google Inc. Query language identification
NZ553484A (en) 2007-02-28 2008-09-26 Optical Systems Corp Ltd Text management software
US20080211777A1 (en) * 2007-03-01 2008-09-04 Microsoft Corporation Stroke number input
US8677237B2 (en) * 2007-03-01 2014-03-18 Microsoft Corporation Integrated pinyin and stroke input
US8316295B2 (en) * 2007-03-01 2012-11-20 Microsoft Corporation Shared language model
US8413049B2 (en) * 2007-08-31 2013-04-02 Research In Motion Limited Handheld electronic device and associated method enabling the generation of a proposed character interpretation of a phonetic text input in a text disambiguation environment
US8010465B2 (en) * 2008-02-26 2011-08-30 Microsoft Corporation Predicting candidates using input scopes
US20090249198A1 (en) * 2008-04-01 2009-10-01 Yahoo! Inc. Techniques for input recogniton and completion
US20090292527A1 (en) * 2008-05-22 2009-11-26 Travelocity.Com Lp Methods, Apparatuses and Computer Program Products for Receiving and Utilizing Multidimensional Data Via A Phrase
US8745051B2 (en) * 2008-07-03 2014-06-03 Google Inc. Resource locator suggestions from input character sequence
JP5501581B2 (ja) * 2008-07-25 2014-05-21 シャープ株式会社 情報処理装置および情報処理方法
JP4827950B2 (ja) * 2008-07-31 2011-11-30 富士通株式会社 サーバ装置
GB0905457D0 (en) * 2009-03-30 2009-05-13 Touchtype Ltd System and method for inputting text into electronic devices
US9424246B2 (en) 2009-03-30 2016-08-23 Touchtype Ltd. System and method for inputting text into electronic devices
US10191654B2 (en) 2009-03-30 2019-01-29 Touchtype Limited System and method for inputting text into electronic devices
US20100325130A1 (en) * 2009-06-19 2010-12-23 Microsoft Corporation Media asset interactive search
US8745065B2 (en) * 2009-07-07 2014-06-03 Google Inc. Query parsing for map search
US8782556B2 (en) 2010-02-12 2014-07-15 Microsoft Corporation User-centric soft keyboard predictive technologies
US8327326B2 (en) * 2010-06-15 2012-12-04 Microsoft Corporation Inserting closing code constructs
US9626456B2 (en) * 2010-10-08 2017-04-18 Warner Bros. Entertainment Inc. Crowd sourcing for file recognition
CN102253929A (zh) * 2011-06-03 2011-11-23 北京搜狗科技发展有限公司 一种提示用户输入字符的方法和装置
CN103493047A (zh) * 2011-08-30 2014-01-01 宇龙计算机通信科技(深圳)有限公司 词库更新装置、输入系统和输入方法及终端
US20130159919A1 (en) 2011-12-19 2013-06-20 Gabriel Leydon Systems and Methods for Identifying and Suggesting Emoticons
US8818791B2 (en) * 2012-04-30 2014-08-26 Google Inc. Techniques for assisting a user in the textual input of names of entities to a user device in multiple different languages
CN104640711B (zh) * 2013-07-30 2016-09-07 京瓷办公信息系统株式会社 显示装置及图像形成装置
US9760624B1 (en) 2013-10-18 2017-09-12 Google Inc. Automatic selection of an input language
WO2015062377A1 (zh) * 2013-11-04 2015-05-07 北京奇虎科技有限公司 一种相似文本检测装置、方法以及应用
CN105095191A (zh) * 2014-04-22 2015-11-25 富士通株式会社 基于多词单元进行辅助翻译的方法和装置
US9043196B1 (en) 2014-07-07 2015-05-26 Machine Zone, Inc. Systems and methods for identifying and suggesting emoticons
US9313219B1 (en) * 2014-09-03 2016-04-12 Trend Micro Incorporated Detection of repackaged mobile applications
US9762385B1 (en) 2015-07-20 2017-09-12 Trend Micro Incorporated Protection of program code of apps of mobile computing devices
CN105069064B (zh) * 2015-07-29 2019-04-30 百度在线网络技术(北京)有限公司 词汇的获取方法及装置、推送方法及装置
CN105138498A (zh) * 2015-08-03 2015-12-09 小米科技有限责任公司 输出字符信息的方法及装置
US9916448B1 (en) 2016-01-21 2018-03-13 Trend Micro Incorporated Detection of malicious mobile apps
GB201610984D0 (en) 2016-06-23 2016-08-10 Microsoft Technology Licensing Llc Suppression of input images
US10375576B1 (en) 2016-09-09 2019-08-06 Trend Micro Incorporated Detection of malware apps that hijack app user interfaces
CN107844199B (zh) * 2016-09-18 2022-03-04 北京搜狗科技发展有限公司 一种输入方法、系统和用于输入的装置
CN108427508B (zh) * 2017-02-15 2024-01-19 北京搜狗科技发展有限公司 输入方法和装置、建立局域网词库的方法和装置
US11250221B2 (en) * 2019-03-14 2022-02-15 Sap Se Learning system for contextual interpretation of Japanese words
CN110737808A (zh) * 2019-09-30 2020-01-31 支付宝(杭州)信息技术有限公司 一种基于区块链的汉字串统计方法及系统
JP2021144271A (ja) * 2020-03-10 2021-09-24 オムロン株式会社 文字入力装置、文字入力方法、および、文字入力プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08212217A (ja) * 1995-02-08 1996-08-20 Toshiba Corp 知識蓄積方法および知識蓄積方法を用いた自然言語処理システム
JPH11338858A (ja) * 1998-05-22 1999-12-10 Toshiba Corp 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体
JP2005107638A (ja) * 2003-09-29 2005-04-21 Casio Comput Co Ltd 通信端末装置および通信端末処理プログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5953541A (en) 1997-01-24 1999-09-14 Tegic Communications, Inc. Disambiguating system for disambiguating ambiguous input sequences by displaying objects associated with the generated input sequences in the order of decreasing frequency of use
US6377965B1 (en) 1997-11-07 2002-04-23 Microsoft Corporation Automatic word completion system for partially entered data
US6356866B1 (en) * 1998-10-07 2002-03-12 Microsoft Corporation Method for converting a phonetic character string into the text of an Asian language
JP2001005807A (ja) * 1999-06-24 2001-01-12 Makoto Iriuchijima 世界語候補用言語およびその翻訳関連単語の登録変換方法
US7165019B1 (en) * 1999-11-05 2007-01-16 Microsoft Corporation Language input architecture for converting one text form to another text form with modeless entry
US6564213B1 (en) 2000-04-18 2003-05-13 Amazon.Com, Inc. Search query autocompletion
US6668085B1 (en) * 2000-08-01 2003-12-23 Xerox Corporation Character matching process for text converted from images
US7165022B2 (en) * 2001-06-13 2007-01-16 Fujitsu Limited Chinese language input system
JP4650920B2 (ja) * 2002-04-16 2011-03-16 富士通株式会社 情報処理装置及び情報処理プログラム
CA2504423C (en) * 2002-10-31 2011-10-18 Arizan Corporation Methods and apparatus for summarizing document content for mobile communication devices
US8285537B2 (en) * 2003-01-31 2012-10-09 Comverse, Inc. Recognition of proper nouns using native-language pronunciation
US7395203B2 (en) * 2003-07-30 2008-07-01 Tegic Communications, Inc. System and method for disambiguating phonetic input
JP4012143B2 (ja) * 2003-12-16 2007-11-21 キヤノン株式会社 情報処理装置およびデータ入力方法
WO2005106705A2 (en) * 2004-04-26 2005-11-10 John Francis Glosson Method, system, and software for embedding metadata objects concomitantly with linguistic content
US20060106769A1 (en) 2004-11-12 2006-05-18 Gibbs Kevin A Method and system for autocompletion for languages having ideographs and phonetic characters

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08212217A (ja) * 1995-02-08 1996-08-20 Toshiba Corp 知識蓄積方法および知識蓄積方法を用いた自然言語処理システム
JPH11338858A (ja) * 1998-05-22 1999-12-10 Toshiba Corp 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体
JP2005107638A (ja) * 2003-09-29 2005-04-21 Casio Comput Co Ltd 通信端末装置および通信端末処理プログラム

Also Published As

Publication number Publication date
US20060241933A1 (en) 2006-10-26
KR101249663B1 (ko) 2013-04-01
US7506254B2 (en) 2009-03-17
WO2006115642A1 (en) 2006-11-02
KR20080000679A (ko) 2008-01-02
CN101203849A (zh) 2008-06-18
CN101203849B (zh) 2010-06-16

Similar Documents

Publication Publication Date Title
JP2008537260A (ja) ユーザ入力の予測変換
US10140371B2 (en) Providing multi-lingual searching of mono-lingual content
JP5634860B2 (ja) 第2言語モードを有する入力メソッドエディタ
KR101465770B1 (ko) 단어 확률 결정
US8745051B2 (en) Resource locator suggestions from input character sequence
US11106873B2 (en) Context-based translation retrieval via multilingual space
JP5462001B2 (ja) 文脈上の入力方法
US8612206B2 (en) Transliterating semitic languages including diacritics
JP4717821B2 (ja) ターゲットページとは異なる文字セットおよび/または言語で書かれたクエリを使用する検索のための方法
US11562144B2 (en) Generative text summarization system and method
KR20120006489A (ko) 입력 방법 편집기
US10402474B2 (en) Keyboard input corresponding to multiple languages
US20140067731A1 (en) Multi-dimensional information entry prediction
JP4266222B2 (ja) 単語翻訳装置およびそのプログラム並びにコンピュータ読み取り可能な記録媒体
JP2018101224A (ja) 検索装置、検索方法、及びプログラム
JP2004118461A (ja) 言語モデルのトレーニング方法、かな漢字変換方法、言語モデルのトレーニング装置、かな漢字変換装置、コンピュータプログラムおよびコンピュータ読み取り可能な記録媒体
Sowmya et al. Transliteration based text input methods for telugu
JP7790449B2 (ja) 情報処理装置、情報処理システム、情報処理方法、およびプログラム
US20240168987A1 (en) Document retrieving apparatus and document retrieving method
Ikegami et al. Flick: Japanese input method editor using N-gram and recurrent neural network language model based predictive text input
CN117171298A (zh) 一种智能文本补全方法、装置、设备及存储介质
JP5817602B2 (ja) 文字入力装置、文字入力による機能実行方法、及び文字入力プログラム
Dhapakhel et al. Kantipur Engineering College
JPH03225462A (ja) ローマ字漢字変換装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110817

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110824

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111117

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120214