urlCluster テーブル関数
指定されたクラスター内の多数のノードから URL のファイルを並列処理します。発信者ノードでは、クラスタ内のすべてのノードへの接続を作成し、URL ファイルパス内のアスタリスクを開示し、各ファイルを動的にディスパッチします。ワーカーノードでは、発信者に次に処理すべきタスクを問い合わせ、それを処理します。すべてのタスクが完了するまでこのプロセスを繰り返します。
構文
引数
引数 | 説明 |
---|---|
cluster_name | リモートおよびローカルサーバーへのアドレスセットと接続パラメータを構築するために使用されるクラスターの名前。 |
URL | GET リクエストを受け入れることができる HTTP または HTTPS サーバーのアドレス。タイプ: String。 |
format | データのフォーマット。タイプ: String。 |
structure | 'UserID UInt64, Name String' 形式のテーブル構造。カラム名とタイプを決定します。タイプ: String。 |
戻り値
指定されたフォーマットと構造、および定義された URL
からのデータを含むテーブル。
例
HTTP サーバーからの String
および UInt32 型のカラムを含むテーブルの最初の 3 行を取得すること。
- 標準の Python 3 ツールを使用して基本的な HTTP サーバーを作成し、起動します。
URL 内のグロブ
中括弧 { }
内のパターンは、シャードのセットを生成するため、またはフェイルオーバーアドレスを指定するために使用されます。サポートされているパターンの種類と例については、remote 関数の説明を参照してください。
パターン内の文字 |
は、フェイルオーバーアドレスを指定するために使用されます。それらは、パターンにリストされた順序と同じ順序で繰り返されます。生成されるアドレスの数は、glob_expansion_max_elements 設定によって制限されています。