AI とは

Alexandra Klepper
Alexandra Klepper

人工知能(AI)には、かつては人間の入力が必要だった複雑な新興技術が数多く含まれており、現在ではコンピュータで実行できるようになっています。大まかに言うと、AI は幅広い問題解決能力と創造性を示す人間以外のプログラムまたはモデルです。

AI という頭字語は、人工知能の分野のさまざまなテクノロジーを表すために同じ意味で使用されることがよくありますが、その範囲は大きく異なる場合があります。

AI と ML を定義する用語とコンセプトは数多くあり、それらは有用なものとなるでしょう。ここでは、Chrome のドキュメントでよく使用される用語、特にクライアントサイド AI に関する用語について説明します。

クライアントサイド AI

ウェブ上のほとんどの AI 機能はサーバーに依存していますが、クライアントサイド AI はユーザーのブラウザで実行され、ユーザーのデバイスで推論を行います。これにより、レイテンシの短縮、機能作成費用の削減、ユーザー プライバシーの強化、オフライン アクセスなど、さまざまなメリットが得られます。

クライアントサイド AI は、パフォーマンス向けに最適化された、より小規模で最適化されたモデルに依存しています。このようなモデルは、特定のタスクで大規模なサーバーサイド モデルよりも優れたパフォーマンスを発揮する可能性があります。ユースケースを評価して、最適なソリューションを判断します。

組み込みの AI

組み込みの AI により、ウェブサイトはブラウザ API を介してローカル プロセッサに接続します。ブラウザの組み込みモデルがレスポンスを送信し、API がそのレスポンスをウェブサイトに返します。

組み込み AI は、クライアント サイド AI の一種で、より小さなモデルがブラウザに組み込まれています。Chrome の場合、これには Gemini Nano とエキスパート モデルが含まれます。これらのモデルをダウンロードすると、組み込みの AI を使用するすべてのウェブサイトとウェブ アプリケーションで、ダウンロード時間をスキップして、機能の実行とローカル推論をすぐに開始できます。

組み込みの AI API は、タスクに適したタイプのモデルに対して推論を実行するように設計されています。たとえば、Prompt API は言語モデルに対して推論を実行し、Translator API は組み込みの専門家モデルに対して推論を実行します。

サーバーサイド AI

サーバーサイド AI には、クラウドベースの AI サービスが含まれます。クラウドで実行されている Gemini 1.5 Pro を考えてみましょう。これらのモデルは、通常、はるかに大きく、強力です。これは特に大規模言語モデルに当てはまります。

ハイブリッド AI

ハイブリッド AI とは、クライアント コンポーネントとサーバー コンポーネントの両方を含むソリューションを指します。次に例を示します。

  • デバイスで効果的に完了できないタスク用に構築された、サーバーサイド モデルにフォールバックするクライアント サイド モデル。
    • デバイスのリソースが不足している可能性があります。
    • モデルまたは API は、特定の環境でのみ使用できます。
  • セキュリティのためにクライアントとサーバー間で分割されたモデル。
    • たとえば、実行の 75% がクライアントで行われ、残りの 25% がサーバーで行われるようにモデルを分割できます。これにより、クライアントサイドのメリットが得られるとともに、モデルの一部をデバイス外に置くことでプライバシーを維持できます。

Prompt API を使用すると、Firebase AI Logic を使用してハイブリッド アーキテクチャを設定できます。

生成 AI

生成 AI は、ユーザーが親しみやすく、人間が作成したかのようなコンテンツを作成するのに役立つ ML の一種です。生成 AI は、言語モデルを使用してデータを整理し、提供されたコンテキストに基づいてテキスト、画像、動画、音声を生成または変更します。生成 AI は、パターン マッチングと予測を超えた機能を提供します。

大規模言語モデル(LLM)には、テキストや画像の生成、分類、要約など、さまざまなタスクの実行に使用できる多数(数十億)のパラメータがあります。

小規模言語モデル(SLM)は、同様のタスクを実行するためのパラメータが大幅に少なく、クライアントサイドで使用できる場合があります。

自然言語処理(NLP)

自然言語処理は、特定の言語のルールから、個人が使用する特異性、方言、スラングまで、コンピュータが人間の言語を理解できるようにすることに重点を置いた ML のクラスです。

エージェントまたは AI エージェント

エージェントは、環境の変化に適応しながら、ユーザーに代わってタスクを完了するための一連のアクションを自律的に計画して実行するソフトウェアです。アクションには、ウェブページまたは Project Mariner などのサードパーティ アプリケーションを通じて実行される API 関数やデータベース クエリが含まれる場合があります。

chatbot は本質的にエージェントではありません。chatbot はメッセンジャー(人間など)に応答し、モデルに依存して質問への回答などのコンテンツを生成しますが、エージェントはツールやデータベースとやり取りしてタスクを完了します。

参考情報

ウェブ上の AI を初めて使用する場合は、web.dev の AI リソースのコレクションをご覧ください。