フォーマット設定
These settings are autogenerated from source.
allow_special_bool_values_inside_variant
Variant型内で "on"、"off"、"enable"、"disable" などの特別なテキストのブール値から Bool値を解析できるようにします。
bool_false_representation
TSV/CSV/Vertical/Pretty形式での偽のブール値を表すためのテキスト。
bool_true_representation
TSV/CSV/Vertical/Pretty形式での真のブール値を表すためのテキスト。
column_names_for_schema_inference
カラム名のリストを使用して、カラム名のない形式でスキーマ推論を行います。形式: 'column1,column2,column3,...'
cross_to_inner_join_rewrite
WHEREセクションに結合式がある場合は、カンマ/クロス結合の代わりに内部結合を使用します。値: 0 - 書き換えなし、1 - 可能な場合はカンマ/クロスに適用、2 - すべてのカンマ結合を強制的に書き換え、cross - 可能な場合
date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands
datetime64値の末尾のゼロを動的に切り詰め、出力スケールを [0, 3, 6] に調整します。 それぞれが '秒'、'ミリ秒'、'マイクロ秒' に対応します。
date_time_input_format
日付と時刻のテキスト表現のパーサーを選択できます。
この設定は date and time functions には適用されません。
可能な値:
-
'best_effort'
— 拡張パーシングを有効にします。ClickHouseは基本的な
YYYY-MM-DD HH:MM:SS
形式とすべてのISO 8601の日付および時刻形式を解析できます。例:'2018-06-08T01:02:03.000Z'
。 -
'best_effort_us'
—best_effort
に似ています(差異についてはparseDateTimeBestEffortUSを参照) -
'basic'
— 基本的なパーサーを使用します。ClickHouseは基本的な
YYYY-MM-DD HH:MM:SS
またはYYYY-MM-DD
形式のみを解析できます。例:2019-08-20 10:18:56
または2019-08-20
。
Cloudのデフォルト値: 'best_effort'
。
参照:
date_time_output_format
日付と時刻のテキスト表現の異なる出力形式を選択できます。
可能な値:
-
simple
- シンプルな出力形式。ClickHouse は日付と時刻を
YYYY-MM-DD hh:mm:ss
形式で出力します。例:2019-08-20 10:18:56
。計算はデータ型のタイムゾーン(存在する場合)またはサーバーのタイムゾーンに従って行われます。 -
iso
- ISO出力形式。ClickHouseは日付と時刻をISO 8601
YYYY-MM-DDThh:mm:ssZ
形式で出力します。例:2019-08-20T10:18:56Z
。出力はUTCであることに注意してください (Z
はUTCを意味します)。 -
unix_timestamp
- Unixタイムスタンプ出力形式。ClickHouseは日付と時刻をUnixタイムスタンプ形式で出力します。例:
1566285536
。
参照:
date_time_overflow_behavior
Date、Date32、DateTime、DateTime64または整数がDate、Date32、DateTime、またはDateTime64に変換されるとき、値が結果の型で表現できない場合の動作を定義します。
可能な値:
ignore
— オーバーフローを静かに無視します。結果は未定義です。throw
— オーバーフローの場合に例外をスローします。saturate
— 結果を飽和させます。値がターゲットタイプで表現可能な最小値よりも小さい場合、結果は表現可能な最小値として選択されます。値がターゲットタイプで表現可能な最大値よりも大きい場合、結果は表現可能な最大値として選択されます。
デフォルト値: ignore
。
dictionary_use_async_executor
辞書ソースを読み取るためのパイプラインを複数のスレッドで実行します。これは、ローカルCLICKHOUSEソースを持つ辞書のみでサポートされています。
errors_output_format
エラーをテキスト出力に書き込む方法。
exact_rows_before_limit
有効にすると、ClickHouseはrows_before_limit_at_least統計の正確な値を提供しますが、そのコストとして制限の前のデータを完全に読み取る必要があります。
format_avro_schema_registry_url
AvroConfluent形式用: Confluent Schema RegistryのURL。
format_binary_max_array_size
RowBinary形式での配列の最大許容サイズ。これにより、破損データの場合の大きなメモリ割り当てが防止されます。0は制限なしを意味します。
format_binary_max_string_size
RowBinary形式での文字列の最大許容サイズ。これにより、破損データの場合の大きなメモリ割り当てが防止されます。0は制限なしを意味します。
format_capn_proto_enum_comparising_mode
ClickHouse EnumとCapnProto Enumのマッピング方法
format_capn_proto_use_autogenerated_schema
format_schemaが設定されていない場合に自動生成されたCapnProtoスキーマを使用します。
format_csv_allow_double_quotes
trueに設定されている場合、二重引用符のある文字列を許可します。
format_csv_allow_single_quotes
trueに設定されている場合、単一引用符のある文字列を許可します。
format_csv_delimiter
CSVデータで区切り文字として考慮される文字。文字列が設定されている場合、文字列の長さは1でなければなりません。
format_csv_null_representation
CSV形式でのカスタムNULL表現
format_custom_escaping_rule
フィールドエスケープルール(CustomSeparated形式用)
format_custom_field_delimiter
フィールド間の区切り文字(CustomSeparated形式用)
format_custom_result_after_delimiter
結果セットの後の接尾辞(CustomSeparated形式用)
format_custom_result_before_delimiter
結果セットの前の接頭辞(CustomSeparated形式用)
format_custom_row_after_delimiter
最終カラムのフィールドの後の区切り文字(CustomSeparated形式用)
format_custom_row_before_delimiter
最初のカラムのフィールドの前の区切り文字(CustomSeparated形式用)
format_custom_row_between_delimiter
行間の区切り文字(CustomSeparated形式用)
format_display_secrets_in_show_and_select
テーブル、データベース、テーブル関数、辞書のために SHOW
および SELECT
クエリでのシークレットの表示を有効または無効にします。
シークレットを表示したいユーザーは、 display_secrets_in_show_and_select
サーバー設定 を有効にし、 displaySecretsInShowAndSelect
権限を持っている必要があります。
可能な値:
- 0 — 無効。
- 1 — 有効。
format_json_object_each_row_column_for_object_name
オブジェクト名を JSONObjectEachRow 形式で格納/書き込むために使用されるカラムの名前です。
カラムタイプはStringである必要があります。値が空の場合、デフォルト名 row_{i}
がオブジェクト名に使用されます。
format_protobuf_use_autogenerated_schema
format_schemaが設定されていない場合に自動生成されたProtobufを使用します。
format_regexp
正規表現(Regexp形式用)
format_regexp_escaping_rule
フィールドエスケープルール(Regexp形式用)
format_regexp_skip_unmatched
正規表現に一致しない行をスキップします(Regexp形式用)
format_schema
このパラメーターは、Cap'n ProtoやProtobufのようにスキーマ定義が必要な形式を使用する際に便利です。値は形式によって異なります。
format_schema_message_name
format_schema
で定義されたスキーマ内の必要なメッセージの名前を定義します。
レガシーformat_schema形式(file_name:message_name
)との互換性を維持するために:
format_schema_message_name
が指定されていない場合、メッセージ名はレガシーformat_schema
値のmessage_name
部分から推測されます。- レガシー形式を使用している際に
format_schema_message_name
が指定されると、エラーが発生します。
format_schema_source
format_schema
のソースを定義します。
可能な値:
- 'file'(デフォルト):
format_schema
はformat_schemas
ディレクトリ内のスキーマファイルの名前です。 - 'string':
format_schema
はスキーマのリテラル内容です。 - 'query':
format_schema
はスキーマを取得するためのクエリです。format_schema_source
が'query'に設定されると、次の条件が適用されます: - クエリは正確に1つの値を返さなければなりません:単一の行と単一の文字列カラム。
- クエリの結果はスキーマ内容として扱われます。
- この結果はローカルに
format_schemas
ディレクトリにキャッシュされます。 - ローカルキャッシュは次のコマンドを使用してクリアできます:
SYSTEM DROP FORMAT SCHEMA CACHE FOR Files
。 - キャッシュされると、同一のクエリはキャッシュが明示的にクリアされるまで再度スキーマを取得するために実行されません。
- ローカルキャッシュファイルに加えて、Protobufメッセージもメモリ内にキャッシュされます。ローカルキャッシュファイルをクリアしても、スキーマを完全に更新するためには、
SYSTEM DROP FORMAT SCHEMA CACHE [FOR Protobuf]
を使用してメモリ内キャッシュもクリアする必要があります。 SYSTEM DROP FORMAT SCHEMA CACHE
クエリを実行すると、ローカルキャッシュファイルとProtobufメッセージスキーマの両方のキャッシュを一度にクリアできます。
format_template_resultset
結果セットのためのフォーマット文字列を含むファイルへのパス(Template形式用)
format_template_resultset_format
結果セットのためのフォーマット文字列(Template形式用)
format_template_row
行のためのフォーマット文字列を含むファイルへのパス(Template形式用)
format_template_row_format
行のためのフォーマット文字列(Template形式用)
format_template_rows_between_delimiter
Template形式用の行間の区切り文字
format_tsv_null_representation
TSV形式でのカスタムNULL表現
input_format_allow_errors_num
テキスト形式(CSV、TSVなど)から読み取るときの受け入れ可能なエラーの最大数を設定します。
デフォルト値は0です。
常に input_format_allow_errors_ratio
とペアにしてください。
行の読み取り中にエラーが発生したが、エラーカウンタがまだ input_format_allow_errors_num
よりも少ない場合、ClickHouseは行を無視して次に進みます。
input_format_allow_errors_num
とinput_format_allow_errors_ratio
の両方を超えた場合、ClickHouseは例外をスローします。
input_format_allow_errors_ratio
テキスト形式(CSV、TSVなど)から読み取るときに許可されるエラーの最大割合を設定します。 エラーの割合は0と1の間の浮動小数点数として設定されます。
デフォルト値は0です。
常に input_format_allow_errors_num
とペアにしてください。
行の読み取り中にエラーが発生したが、エラーカウンタがまだ input_format_allow_errors_ratio
よりも少ない場合、ClickHouseは行を無視して次に進みます。
input_format_allow_errors_num
とinput_format_allow_errors_ratio
の両方を超えた場合、ClickHouseは例外をスローします。
input_format_allow_seeks
ORC/Parquet/Arrow入力形式での読み取り中にシークを許可します。
デフォルトで有効になっています。
input_format_arrow_allow_missing_columns
Arrow入力形式での読み取り中に欠落しているカラムを許可します。
input_format_arrow_case_insensitive_column_matching
ArrowカラムとCHカラムの一致の際に大文字小文字を無視します。
input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference
Arrow形式のスキーマ推論中にサポートされていないタイプのカラムをスキップします。
input_format_avro_allow_missing_fields
Avro/AvroConfluent形式: スキーマにフィールドが見つからない場合は、エラーの代わりにデフォルト値を使用します。
input_format_avro_null_as_default
Avro/AvroConfluent形式: nullかつNullableでないカラムの場合、デフォルトを挿入します。
input_format_binary_decode_types_in_binary_format
RowBinaryWithNamesAndTypes入力形式でタイプ名の代わりにバイナリ形式でデータ型を読み取ります。
input_format_binary_read_json_as_string
RowBinary入力形式でJSONデータ型の値をJSON String値として読み取ります。
input_format_bson_skip_fields_with_unsupported_types_in_schema_inference
BSON形式のスキーマ推論中にサポートされていないタイプのフィールドをスキップします。
input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference
CapnProto形式のスキーマ推論中にサポートされていないタイプのカラムをスキップします。
input_format_csv_allow_cr_end_of_line
trueに設定されている場合、行の終わりに\rが許可されます。
input_format_csv_allow_variable_number_of_columns
CSV入力で余分なカラムを無視し(ファイルに期待されるカラムよりも多い場合)、CSV入力の欠落フィールドをデフォルト値として扱います。
input_format_csv_allow_whitespace_or_tab_as_delimiter
CSV文字列でフィールド区切り文字としてスペースやタブ(\t)を使用することを許可します。
input_format_csv_arrays_as_nested_csv
CSVから配列を読み取る際に、その要素がネストされたCSVとしてシリアル化され、文字列に格納されていることを期待します。例: "[""Hello"", ""world"", ""42"""" TV""]"。配列の周囲の波かっこは省略できます。
input_format_csv_deserialize_separate_columns_into_tuple
trueに設定すると、CSV形式で書き込まれた別々のカラムをTupleカラムにデシリアライズできます。
input_format_csv_detect_header
CSV形式で名前とタイプのあるヘッダーを自動的に検出します。
input_format_csv_empty_as_default
CSV入力の空のフィールドをデフォルト値として扱います。
input_format_csv_enum_as_number
CSV形式で挿入されたenum値をenumインデックスとして扱います。
input_format_csv_skip_first_lines
CSV形式のデータの開始部分で指定された行数をスキップします。
input_format_csv_skip_trailing_empty_lines
CSV形式で末尾の空行をスキップします。
input_format_csv_trim_whitespaces
CSV文字列の先頭と末尾の空白とタブ(\t)文字をトリムします。
input_format_csv_try_infer_numbers_from_strings
有効な場合、スキーマ推論中にClickHouseは文字列フィールドから数値を推測しようとします。 これは、CSVデータに引用符で囲まれたUInt64の数値が含まれている場合に便利です。
デフォルトでは無効です。
input_format_csv_try_infer_strings_from_quoted_tuples
入力データの引用符で囲まれたタプルをString型の値として解釈します。
input_format_csv_use_best_effort_in_schema_inference
CSV形式でスキーマを推論するためにいくつかの調整とヒューリスティックを使用します。
input_format_csv_use_default_on_bad_values
CSVフィールドデシリアライズが不正な値で失敗した場合に、そのカラムにデフォルト値を設定することを可能にします。
input_format_custom_allow_variable_number_of_columns
CustomSeparated入力で余分なカラムを無視し(ファイルに期待されるカラムよりも多い場合)、CustomSeparated入力の欠落フィールドをデフォルト値として扱います。
input_format_custom_detect_header
CustomSeparated形式で名前とタイプのあるヘッダーを自動的に検出します。
input_format_custom_skip_trailing_empty_lines
CustomSeparated形式で末尾の空行をスキップします。
input_format_defaults_for_omitted_fields
INSERT
クエリを実行する際に、省略された入力カラム値をそれぞれのカラムのデフォルト値で置き換えます。このオプションは、JSONEachRow(およびその他のJSON形式)、CSV、TabSeparated、TSKV、Parquet、Arrow、Avro、ORC、Native形式およびWithNames
/WithNamesAndTypes
サフィックスを持つ形式に適用されます。
このオプションが有効になっていると、拡張テーブルメタデータがサーバーからクライアントに送信されます。これにより、サーバーの追加計算リソースを消費し、パフォーマンスが低下する可能性があります。
可能な値:
- 0 — 無効。
- 1 — 有効。
input_format_force_null_for_omitted_fields
省略されたフィールドをnull値で強制的に初期化します。
input_format_hive_text_allow_variable_number_of_columns
Hiveテキスト入力で余分なカラムを無視し(ファイルに期待されるカラムよりも多い場合)、Hiveテキスト入力の欠落フィールドをデフォルト値として扱います。
input_format_hive_text_collection_items_delimiter
Hiveテキストファイル内のコレクション(配列またはマップ)アイテム間の区切り文字。
input_format_hive_text_fields_delimiter
Hiveテキストファイル内のフィールド間の区切り文字。
input_format_hive_text_map_keys_delimiter
Hiveテキストファイル内のマップキー/値のペア間の区切り文字。
input_format_import_nested_json
ネストされたオブジェクトを持つJSONデータの挿入を有効または無効にします。
サポートされている形式:
可能な値:
- 0 — 無効。
- 1 — 有効。
参照:
- Usage of Nested Structures with the
JSONEachRow
形式。
input_format_ipv4_default_on_conversion_error
IPv4のデシリアライズは、変換エラーが発生した場合にデフォルト値を使用します。
デフォルトでは無効です。
input_format_ipv6_default_on_conversion_error
IPV6のデシリアライズは、変換エラーが発生した場合にデフォルト値を使用します。
デフォルトでは無効です。
input_format_json_compact_allow_variable_number_of_columns
JSONCompact/JSONCompactEachRow入力形式の行で可変数のカラムを許可します。 余分なカラムがある行を無視し、欠落したカラムをデフォルト値として扱います。
デフォルトでは無効です。
input_format_json_defaults_for_missing_elements_in_named_tuple
名前付きタプルを解析する際に、JSONオブジェクトの欠落している要素にデフォルト値を挿入します。
この設定は、設定input_format_json_named_tuples_as_objects
が有効なときのみ機能します。
デフォルトでは有効です。
input_format_json_empty_as_default
有効な場合、JSONの空の入力フィールドをデフォルト値で置き換えます。複雑なデフォルト式には、input_format_defaults_for_omitted_fields
も有効にする必要があります。
可能な値:
- 0 — 無効。
- 1 — 有効。
input_format_json_ignore_unknown_keys_in_named_tuple
名前付きタプル用にJSONオブジェクト内の未知のキーを無視します。
デフォルトでは有効です。
input_format_json_ignore_unnecessary_fields
不必要なフィールドを無視し、解析しません。これを有効にすると、無効な形式のJSON文字列や重複フィールドに対して例外が発生しない場合があります。
input_format_json_infer_array_of_dynamic_from_array_of_different_types
有効な場合、スキーマ推論中にClickHouseはさまざまなデータ型の値を持つJSON配列に対してArray(Dynamic)型を使用します。
例:
デフォルトでは有効です。
input_format_json_infer_incomplete_types_as_strings
スキーマ推論中にデータサンプル内の Null
/ {}
/ []
のみを含むJSONキーにString型を使用できるようにします。
JSON形式では任意の値をStringとして読み取ることができ、スキーマ推論中にcolumn_name
の最初の25000行のデータからタイプを判断できないというエラーを回避できます。
例:
結果:
デフォルトでは有効です。
input_format_json_map_as_array_of_tuples
マップカラムをJSONタプルの配列としてデシリアライズします。
デフォルトでは無効です。
input_format_json_max_depth
JSON内のフィールドの最大深度。これは厳密な制限ではなく、正確に適用する必要はありません。
input_format_json_named_tuples_as_objects
名前付きタプルカラムをJSONオブジェクトとして解析します。
デフォルトでは有効です。
input_format_json_read_arrays_as_strings
JSON入力形式でJSON配列を文字列として解析することを許可します。
例:
結果:
デフォルトでは有効です。
input_format_json_read_bools_as_numbers
JSON入力形式でブール値を数値として解析することを許可します。
デフォルトでは有効です。
input_format_json_read_bools_as_strings
JSON入力形式でブール値を文字列として解析することを許可します。
デフォルトでは有効です。
input_format_json_read_numbers_as_strings
JSON入力形式で数値を文字列として解析することを許可します。
デフォルトでは有効です。
input_format_json_read_objects_as_strings
JSON入力形式でJSONオブジェクトを文字列として解析することを許可します。
例:
結果:
デフォルトでは有効です。
input_format_json_throw_on_bad_escape_sequence
JSON入力形式でJSON文字列に不正なエスケープシーケンスが含まれている場合、例外をスローします。無効にすると、不正なエスケープシーケンスはデータ内にそのまま残ります。
デフォルトでは有効です。
input_format_json_try_infer_named_tuples_from_objects
有効な場合、スキーマ推論中にClickHouseはJSONオブジェクトから名前付きタプルを推測しようとします。 結果として生成された名前付きタプルは、サンプルデータ内のすべての対応するJSONオブジェクトからのすべての要素を含むことになります。
例:
結果:
デフォルトでは有効です。
input_format_json_try_infer_numbers_from_strings
有効な場合、スキーマ推論中にClickHouseは文字列フィールドから数値を推測しようとします。 これは、JSONデータに引用符で囲まれたUInt64の数値が含まれている場合に便利です。
デフォルトでは無効です。
input_format_json_use_string_type_for_ambiguous_paths_in_named_tuples_inference_from_objects
名前付きタプル推論において、JSONオブジェクト内の曖昧なパスに対して例外の代わりにString型を使用します。
input_format_json_validate_types_from_metadata
JSON/JSONCompact/JSONColumnsWithMetadata入力形式では、この設定が1に設定されている場合、入力データ内のメタデータからの型がテーブルの対応するカラムの型と比較されます。
デフォルトでは有効です。
input_format_max_block_size_bytes
入力形式でのデータ解析中にブロックのサイズをバイト単位で制限します。ClickHouse側でブロックが形成される行ベースの入力形式で使用されます。 0はバイトでの制限なしを意味します。
input_format_max_bytes_to_read_for_schema_inference
自動スキーマ推論のために読み取る最大データサイズ(バイト単位)。
input_format_max_rows_to_read_for_schema_inference
自動スキーマ推論のために読み取る最大行数。
input_format_msgpack_number_of_columns
挿入されたMsgPackデータのカラム数。データからの自動スキーマ推論で使用されます。
input_format_mysql_dump_map_column_names
MySQLダンプ内のテーブルのカラムとClickHouseテーブルのカラムを名前で一致させます。
input_format_mysql_dump_table_name
データを読み取るためにMySQLダンプ内のテーブルの名前。
input_format_native_allow_types_conversion
Native入力形式でのデータ型の変換を許可します。
input_format_native_decode_types_in_binary_format
Native入力形式で型名の代わりにバイナリ形式でデータ型を読み取ります。
input_format_null_as_default
NULLフィールドをdefault valuesで初期化することを有効または無効にします。
これらのフィールドのデータ型がnullableでない場合、これが適用されます。
カラムタイプがnullableでない場合、この設定が無効な場合、NULL
を挿入すると例外が発生します。カラムタイプがnullableの場合、NULL
値はこの設定にかかわらずそのまま挿入されます。
この設定はほとんどの入力形式に適用されます。
複雑なデフォルト式には、input_format_defaults_for_omitted_fields
も有効にする必要があります。
可能な値:
- 0 — nullableでないカラムに
NULL
を挿入すると例外が発生します。 - 1 —
NULL
フィールドがデフォルトのカラム値で初期化されます。
input_format_orc_allow_missing_columns
ORC入力形式での読み取り中に欠落しているカラムを許可します。
input_format_orc_case_insensitive_column_matching
ORC カラムと CH カラムをマッチングする際に、大文字と小文字を区別しません。
input_format_orc_dictionary_as_low_cardinality
ORC ファイルを読み込む際に、ORC 辞書エンコードされたカラムを LowCardinality カラムとして扱います。
input_format_orc_filter_push_down
ORC ファイルを読み込む際に、WHERE/PREWHERE 式、最小/最大統計または ORC メタデータ内のブルームフィルタに基づいて、全体のストライプまたは行グループをスキップします。
input_format_orc_reader_time_zone_name
ORC 行リーダーのタイムゾーン名。デフォルトの ORC 行リーダーのタイムゾーンは GMT です。
input_format_orc_row_batch_size
ORC ストライプを読み込む際のバッチサイズ。
input_format_orc_skip_columns_with_unsupported_types_in_schema_inference
ORC フォーマットのスキーマ推測中に、サポートされていない型のカラムをスキップします。
input_format_orc_use_fast_decoder
より高速な ORC デコーダー実装を使用します。
input_format_parquet_allow_geoparquet_parser
配列 (UInt8) を Point/LineString/Polygon/MultiLineString/MultiPolygon 型に変換するために、ジオカラムパーサを使用します。
input_format_parquet_allow_missing_columns
Parquet 入力フォーマットを読み込む際に、欠損したカラムを許可します。
input_format_parquet_bloom_filter_push_down
Parquet ファイルを読み込む際に、WHERE 式と Parquet メタデータ内のブルームフィルタに基づいて、全体の行グループをスキップします。
input_format_parquet_case_insensitive_column_matching
Parquet カラムと CH カラムをマッチングする際に、大文字と小文字を区別しません。
input_format_parquet_enable_json_parsing
Parquet ファイルを読み込む際に、JSON カラムを ClickHouse JSON カラムとして解析します。
input_format_parquet_enable_row_group_prefetch
Parquet 解析中に、行グループの先読みを有効にします。現在、単一スレッドの解析のみが先読み可能です。
input_format_parquet_filter_push_down
Parquet ファイルを読み込む際に、WHERE/PREWHERE 式と Parquet メタデータ内の最小/最大統計に基づいて、全体の行グループをスキップします。
input_format_parquet_local_file_min_bytes_for_seek
Parquet 入力フォーマットで、シークを行うために必要なローカル読み取り (ファイル) の最小バイト数。
input_format_parquet_max_block_size
Parquet リーダーの最大ブロックサイズ。
input_format_parquet_memory_high_watermark
Parquet リーダー v3 の近似メモリ制限。並行して読み込むことができる行グループやカラムの数を制限します。1 つのクエリで複数のファイルを読み込む際は、そのファイル全体のメモリ使用量に対して制限がかかります。
input_format_parquet_memory_low_watermark
メモリ使用量がしきい値を下回っている場合、先読みをより積極的にスケジュールします。ネットワーク経由で多くの小さなブルームフィルタを読み込む必要がある場合に特に有用です。
input_format_parquet_page_filter_push_down
カラムインデックスからの最小/最大値を使用してページをスキップします。
input_format_parquet_prefer_block_bytes
Parquet リーダーによる平均ブロックバイト数の出力。
input_format_parquet_preserve_order
Parquet ファイルから読み込む際に行の順序を変更しないようにします。行の順序は一般的に保証されないため、推奨されません。他のクエリパイプライン部分がこれを破壊する可能性があります。その代わりに ORDER BY _row_number
を使用してください。
input_format_parquet_skip_columns_with_unsupported_types_in_schema_inference
Parquet フォーマットのスキーマ推測中に、サポートされていない型のカラムをスキップします。
input_format_parquet_use_native_reader
ネイティブの Parquet リーダー v1 を使用します。比較的速いですが未完成です。廃止予定です。
input_format_parquet_use_native_reader_v3 {#input_format_parquet_use_native_reader_v3} Experimental feature. Learn more.
Parquet リーダー v3 を使用します。実験的です。
input_format_parquet_use_offset_index
ページフィルタが使用されていない場合に、Parquet ファイルからページを読み込む方法を微調整します。
input_format_protobuf_flatten_google_wrappers
通常の非ネスト型カラムに対して Google ラッパーを有効にします。たとえば、文字列カラム 'str' に対する google.protobuf.StringValue 'str'。Nullable カラムの場合、空のラッパーはデフォルトとして認識され、欠損は null として扱われます。
input_format_protobuf_oneof_presence
protobuf oneof のどのフィールドが見つかったかを特別なカラムに列挙値を設定することによって示します。
input_format_protobuf_skip_fields_with_unsupported_types_in_schema_inference
Protobuf フォーマットのスキーマ推測中に、サポートされていない型のフィールドをスキップします。
input_format_record_errors_file_path
テキストフォーマット (CSV, TSV) を読み込む際のエラーを記録するために使用されるファイルのパスです。
input_format_skip_unknown_fields
追加データの挿入をスキップするかどうかを有効化または無効化します。
データを書き込む際に、ClickHouse は入力データにターゲットテーブルに存在しないカラムが含まれている場合に例外をスローします。スキップが有効になっている場合、ClickHouse は追加データを挿入せず、例外をスローしません。
サポートされているフォーマット:
- JSONEachRow (および他の JSON フォーマット)
- BSONEachRow (および他の JSON フォーマット)
- TSKV
- WithNames/WithNamesAndTypes サフィックスを持つすべてのフォーマット
- MySQLDump
- Native
可能な値:
- 0 — 無効。
- 1 — 有効。
input_format_try_infer_dates
有効になっている場合、ClickHouse はテキストフォーマットのスキーマ推測中に文字列フィールドから Date
型を推測します。入力データのカラムからすべてのフィールドが日付として正常に解析されると、結果型は Date
になります。少なくとも 1 つのフィールドが日付として解析されなかった場合、結果型は String
になります。
デフォルトで有効です。
input_format_try_infer_datetimes
有効になっている場合、ClickHouse はテキストフォーマットのスキーマ推測中に文字列フィールドから DateTime64
型を推測します。入力データのカラムからすべてのフィールドが日付時刻として正常に解析されると、結果型は DateTime64
になります。少なくとも 1 つのフィールドが日付時刻として解析されなかった場合、結果型は String
になります。
デフォルトで有効です。
input_format_try_infer_datetimes_only_datetime64
input_format_try_infer_datetimes が有効な場合、DateTime 型ではなく DateTime64 のみを推測します。
input_format_try_infer_exponent_floats
テキストフォーマットのスキーマ推測中に浮動小数点を指数表記で推測しようとします (JSON を除く、そこでは常に指数数字が推測されます)。
input_format_try_infer_integers
有効になっている場合、ClickHouse はテキストフォーマットのスキーマ推測中に浮動小数点ではなく整数を推測しようとします。入力データのカラム内のすべての数値が整数の場合、結果型は Int64
になります。少なくとも 1 つの数値が浮動小数点の場合、結果型は Float64
になります。
デフォルトで有効です。
input_format_try_infer_variants
有効になっている場合、ClickHouse はテキストフォーマットのスキーマ推測中にカラム/配列要素に複数の可能な型がある場合に Variant
型を推測しようとします。
可能な値:
- 0 — 無効。
- 1 — 有効。
input_format_tsv_allow_variable_number_of_columns
TSV 入力で追加のカラムを無視し (ファイルに予想以上のカラムがある場合)、TSV 入力の欠損フィールドをデフォルト値として扱います。
input_format_tsv_crlf_end_of_line
真に設定されている場合、ファイル関数は TSV フォーマットを \r\n で読み込みます。\n ではありません。
input_format_tsv_detect_header
TSV フォーマット内で名前と型によるヘッダーを自動的に検出します。
input_format_tsv_empty_as_default
TSV 入力の空フィールドをデフォルト値として扱います。
input_format_tsv_enum_as_number
TSV フォーマットで挿入された列挙値を列挙インデックスとして扱います。
input_format_tsv_skip_first_lines
TSV フォーマット内でデータの最初に指定された行数をスキップします。
input_format_tsv_skip_trailing_empty_lines
TSV フォーマット内で末尾の空行をスキップします。
input_format_tsv_use_best_effort_in_schema_inference
TSV フォーマットのスキーマ推測においていくつかの微調整やヒューリスティクスを使用します。
input_format_values_accurate_types_of_literals
Values フォーマット: テンプレートを使用して式を解析および解釈する際に、オーバーフローや精度問題を回避するためにリテラルの実際の型をチェックします。
input_format_values_deduce_templates_of_expressions
Values フォーマット: フィールドがストリーミングパーサーによって解析できなかった場合、SQL パーサーを実行し、SQL 式のテンプレートを推測し、すべての行をテンプレートを使用して解析してから、すべての行の式を解釈します。
input_format_values_interpret_expressions
Values フォーマット: フィールドがストリーミングパーサーによって解析できなかった場合、SQL パーサーを実行し、それを SQL 式として解釈しようとします。
input_format_with_names_use_header
データ挿入時にカラムの順序をチェックするかどうかを有効または無効にします。
挿入パフォーマンスを向上させるために、入力データのカラムの順序がターゲットテーブルと同じであることが確信できる場合は、このチェックを無効にすることをお勧めします。
サポートされているフォーマット:
- CSVWithNames
- CSVWithNamesAndTypes
- TabSeparatedWithNames
- TabSeparatedWithNamesAndTypes
- JSONCompactEachRowWithNames
- JSONCompactEachRowWithNamesAndTypes
- JSONCompactStringsEachRowWithNames
- RowBinaryWithNames
- RowBinaryWithNamesAndTypes
- CustomSeparatedWithNames
- CustomSeparatedWithNamesAndTypes
可能な値:
- 0 — 無効。
- 1 — 有効。
input_format_with_types_use_header
フォーマットパーサーが入力データのデータ型がターゲットテーブルのデータ型と一致しているかどうかをチェックするかどうかを制御します。
サポートされているフォーマット:
- CSVWithNamesAndTypes
- TabSeparatedWithNamesAndTypes
- JSONCompactEachRowWithNamesAndTypes
- JSONCompactStringsEachRowWithNamesAndTypes
- RowBinaryWithNamesAndTypes
- CustomSeparatedWithNamesAndTypes
可能な値:
- 0 — 無効。
- 1 — 有効。
insert_distributed_one_random_shard
分散キーがないときに、Distributed テーブルへのランダム シャード挿入を有効または無効にします。
デフォルトでは、シャードが 1 つ以上の Distributed
テーブルにデータを挿入する場合、分散キーが指定されていないと、ClickHouse サーバーはすべての挿入リクエストを拒否します。 insert_distributed_one_random_shard = 1
の場合、挿入が許可され、データがすべてのシャードの中でランダムに転送されます。
可能な値:
- 0 — 複数のシャードがあり、分散キーが指定されていない場合は挿入が拒否されます。
- 1 — 分散キーが指定されていない場合は、利用可能なシャードの中でランダムに挿入が行われます。
interval_output_format
インターバル型のテキスト表現の異なる出力フォーマットを選択できるようにします。
可能な値:
-
kusto
- KQL スタイルの出力フォーマット。ClickHouse はインターバルを KQL フォーマット で出力します。たとえば、
toIntervalDay(2)
は2.00:00:00
としてフォーマットされます。長さが異なるインターバル型 (例:IntervalMonth
やIntervalYear
) の場合、平均秒数が考慮されます。 -
numeric
- 数値出力フォーマット。ClickHouse はインターバルをその基礎となる数値表現として出力します。たとえば、
toIntervalDay(2)
は2
としてフォーマットされます。
参照:
json_type_escape_dots_in_keys
有効になっている場合、JSON キー内のドットは解析中にエスケープされます。
output_format_arrow_compression_method
Arrow 出力フォーマットの圧縮方法。サポートされているコーデック: lz4_frame, zstd, none (非圧縮)
output_format_arrow_fixed_string_as_fixed_byte_array
固定文字列カラムに対して Binary の代わりに Arrow FIXED_SIZE_BINARY 型を使用します。
output_format_arrow_low_cardinality_as_dictionary
LowCardinality 型を Dictionary Arrow 型として出力することを有効にします。
output_format_arrow_string_as_string
String カラムに対して Binary の代わりに Arrow String 型を使用します。
output_format_arrow_use_64_bit_indexes_for_dictionary
Arrow フォーマットにおける辞書インデックスに対して常に 64 ビット整数を使用します。
output_format_arrow_use_signed_indexes_for_dictionary
Arrow フォーマットにおける辞書インデックスに対して符号付き整数を使用します。
output_format_avro_codec
圧縮コーデックの出力に使用されます。可能な値: 'null', 'deflate', 'snappy', 'zstd'。
output_format_avro_rows_in_file
ファイル内の最大行数 (ストレージによって許可される場合)。
output_format_avro_string_column_pattern
Avro フォーマット: AVRO 文字列として選択する String カラムの正規表現。
output_format_avro_sync_interval
バイトの同期間隔。
output_format_binary_encode_types_in_binary_format
RowBinaryWithNamesAndTypes 出力フォーマットで、型名の代わりにデータ型をバイナリ形式で書き込みます。
output_format_binary_write_json_as_string
RowBinary 出力フォーマットで JSON データ型の値を JSON String 値として書き込みます。
output_format_bson_string_as_string
String カラムに対して Binary の代わりに BSON String 型を使用します。
output_format_csv_crlf_end_of_line
真に設定されている場合、CSV フォーマットの行末は \r\n になります。\n の代わりに。
output_format_csv_serialize_tuple_into_separate_columns
これが true に設定されている場合、CSV フォーマット内のタプルは別のカラムとしてシリアライズされます (つまり、タプル内でのネストが失われます)。
output_format_decimal_trailing_zeros
Decimal 値を印刷する際に、末尾のゼロを出力します。例: 1.230000 の代わりに 1.23。
デフォルトでは無効です。
output_format_json_array_of_rows
すべての行を JSONEachRow フォーマットの JSON 配列として出力する機能を有効にします。
可能な値:
- 1 — ClickHouse はすべての行を配列として出力し、各行は
JSONEachRow
フォーマットです。 - 0 — ClickHouse は各行を個別に出力します。
有効な設定でのクエリの例
クエリ:
結果:
無効な設定でのクエリの例
クエリ:
結果:
output_format_json_escape_forward_slashes
JSON 出力フォーマットでの文字列出力のスラッシュをエスケープするかどうかを制御します。これは JavaScript との互換性のためです。常にエスケープされるバックスラッシュと混同しないでください。
デフォルトでは有効です。
output_format_json_map_as_array_of_tuples
マップカラムを JSON のタプルの配列としてシリアライズします。
デフォルトでは無効です。
output_format_json_named_tuples_as_objects
名前付きタプルカラムを JSON オブジェクトとしてシリアライズします。
デフォルトでは有効です。
output_format_json_pretty_print
この設定は、JSON 出力フォーマットを使用しているときに、タプル、マップ、および配列などのネスト構造が data
配列内でどのように表示されるかを決定します。
たとえば、出力が次のようになります:
出力は次のようにフォーマットされます:
デフォルトでは有効です。
output_format_json_quote_64bit_floats
JSON*フォーマットで出力されるときに 64 ビット 浮動小数点 の引用を制御します。
デフォルトでは無効です。
output_format_json_quote_64bit_integers
JSON フォーマットで出力されるときに 64 ビットまたはそれ以上の 整数 (例: UInt64
または Int128
) の引用を制御します。これらの整数はデフォルトで引用符で囲まれています。この動作は、ほとんどの JavaScript 実装と互換性があります。
可能な値:
- 0 — 整数は引用なしで出力されます。
- 1 — 整数は引用符で囲まれます。
output_format_json_quote_decimals
JSON 出力フォーマットにおけるデシマルの引用を制御します。
デフォルトでは無効です。
output_format_json_quote_denormals
JSON 出力フォーマットでの +nan
, -nan
, +inf
, -inf
出力を有効にします。
可能な値:
- 0 — 無効。
- 1 — 有効。
例
次のテーブル account_orders
を考えてみましょう:
output_format_json_quote_denormals = 0
の場合、クエリは出力に null
値を返します:
output_format_json_quote_denormals = 1
の場合、クエリは次の内容を返します:
output_format_json_skip_null_value_in_named_tuples
JSON オブジェクトとして名前付きタプルカラムをシリアライズする際、null 値のキー値ペアをスキップします。これは、output_format_json_named_tuples_as_objects が true の場合にのみ有効です。
output_format_json_validate_utf8
JSON 出力フォーマットにおける UTF-8 シーケンスの検証を制御します。これらは JSON/JSONCompact/JSONColumnsWithMetadata フォーマットには影響せず、常に UTF-8 を検証します。
デフォルトでは無効です。
output_format_markdown_escape_special_characters
有効な場合、Markdown 内の特殊文字をエスケープします。
Common Mark は、\ でエスケープできる特殊文字を次のように定義しています:
可能な値:
- 0 — 無効。
- 1 — 有効。
output_format_msgpack_uuid_representation
MsgPack 形式で UUID を出力する方法。
output_format_native_encode_types_in_binary_format
ネイティブ出力フォーマットで型名の代わりにデータ型をバイナリ形式で書き込みます。
output_format_native_use_flattened_dynamic_and_json_serialization
JSON および Dynamic カラムのデータをフラット形式で書き込みます (すべての型/パスを別のサブカラムとして扱います)。
output_format_native_write_json_as_string
JSON カラムのデータを、デフォルトのネイティブ JSON シリアル化の代わりに JSON 文字列を含む String カラムとして書き込みます。
output_format_orc_compression_block_size
ORC 出力フォーマットでの圧縮ブロックのサイズ (バイト単位)。
output_format_orc_compression_method
ORC 出力フォーマットの圧縮方法。サポートされているコーデック: lz4, snappy, zlib, zstd, none (非圧縮)。
output_format_orc_dictionary_key_size_threshold
ORC 出力フォーマットの文字列カラムについて、異なる値の数が非 null 行の総数のこの割合を超える場合、辞書エンコードをオフにします。そうでなければ、辞書エンコードが有効になります。
output_format_orc_row_index_stride
ORC 出力フォーマットにおけるターゲット行インデックスのストライド。
output_format_orc_string_as_string
String カラムに対して Binary の代わりに ORC String 型を使用します。
output_format_orc_writer_time_zone_name
ORC ライターのタイムゾーン名。デフォルトの ORC ライターのタイムゾーンは GMT です。
output_format_parquet_batch_size
この数の行ごとにページサイズを確認します。平均値サイズが数 KB を超えるカラムがある場合は、減らすことを検討してください。
output_format_parquet_bloom_filter_bits_per_value
Parquet ブルームフィルタ内で各異なる値に使用するビットの近似数。推定の誤検知率:
- 6 ビット - 10%
- 10.5 ビット - 1%
- 16.9 ビット - 0.1%
- 26.4 ビット - 0.01%
- 41 ビット - 0.001%
output_format_parquet_bloom_filter_flush_threshold_bytes
Parquet ファイル内でブルームフィルタを配置する場所。このサイズのグループにまとめてブルームフィルタが書き込まれます。具体的には:
- 0 の場合、各行グループのブルームフィルタは行グループの直後に書き込まれます。
- すべてのブルームフィルタの合計サイズを超える場合、すべての行グループのブルームフィルタがメモリに蓄積され、その後ファイルの終わり近くで一緒に書き込まれます。
- そうでない場合、ブルームフィルタはメモリに蓄積され、合計サイズがこの値を超えるときに書き出されます。
output_format_parquet_compliant_nested_types
Parquet ファイルスキーマでは、リスト要素の名前に 'item' の代わりに 'element' を使用します。これは Arrow ライブラリの実装の歴史的な遺物です。一般的には互換性が向上しますが、一部の古いバージョンの Arrow には影響する可能性があります。
output_format_parquet_compression_method
Parquet 出力フォーマットの圧縮方法。サポートされているコーデック: snappy, lz4, brotli, zstd, gzip, none (非圧縮)。
output_format_parquet_data_page_size
圧縮前のバイト単位でのターゲットページサイズ。
output_format_parquet_date_as_uint16
Date 値をプレーンな 16 ビット数値 (UInt16 として読み取る) として書き込み、32 ビットの Parquet DATE 型 (Date32 として読み取る) に変換しません。
output_format_parquet_datetime_as_uint32
DateTime 値を生の Unix タイムスタンプ (UInt32 として読み取る) として書き込み、ミリ秒 (DateTime64(3) として読み取る) に変換しません。
output_format_parquet_enum_as_byte_array
Parquet 物理型: BYTE_ARRAY および論理型: ENUM を使用して列挙を記述します。
output_format_parquet_fixed_string_as_fixed_byte_array
Parquet FIXED_LENGTH_BYTE_ARRAY 型を Binary の代わりに固定文字列カラムに使用します。
output_format_parquet_geometadata
Parquet メタデータ内でジオカラムに関する情報を記述し、カラムを WKB 形式でエンコードできるようにします。
output_format_parquet_max_dictionary_size
辞書サイズがこのバイト数を超える場合、辞書なしでのエンコーディングに切り替えます。辞書エンコードを無効にするには、0 に設定します。
output_format_parquet_parallel_encoding
複数のスレッドでの Parquet エンコーディングを行います。output_format_parquet_use_custom_encoder が必要です。
output_format_parquet_row_group_size
ターゲット行グループサイズ (行数)。
output_format_parquet_row_group_size_bytes
圧縮前のターゲット行グループサイズ (バイト単位)。
output_format_parquet_string_as_string
String カラムに対して Parquet String 型を使用します。
output_format_parquet_use_custom_encoder
より高速な Parquet エンコーダー実装を使用します。
output_format_parquet_version
出力フォーマットの Parquet 形式バージョン。サポートされているバージョン: 1.0, 2.4, 2.6 および 2.latest (デフォルト)。
output_format_parquet_write_bloom_filter
Parquet ファイルにブルームフィルタを書き込みます。output_format_parquet_use_custom_encoder = true が必要です。
output_format_parquet_write_page_index
Parquet ファイルにカラムインデックスとオフセットインデックス (すなわち、読み取り時のフィルタプッシュダウンに使用できる各データページに関する統計) を記述します。
output_format_pretty_color
Pretty フォーマットで ANSI エスケープシーケンスを使用します。0 - 無効、1 - 有効、'auto' - ターミナルの場合は有効です。
output_format_pretty_display_footer_column_names
テーブル行が多数ある場合、フッターにカラム名を表示します。
可能な値:
- 0 — フッターにカラム名は表示されません。
- 1 — 行数が output_format_pretty_display_footer_column_names_min_rows で設定されたしきい値 (デフォルトでは 50) 以上の場合、フッターにカラム名が表示されます。
例
クエリ:
結果:
output_format_pretty_display_footer_column_names_min_rows
output_format_pretty_display_footer_column_names が有効な場合、カラム名付きのフッターが表示される最小行数を設定します。
output_format_pretty_fallback_to_vertical
有効にすると、テーブルが幅広で短い場合、Pretty形式はVertical形式のように出力されます。
この動作を詳細に調整するために、output_format_pretty_fallback_to_vertical_max_rows_per_chunk
および output_format_pretty_fallback_to_vertical_min_table_width
を参照してください。
output_format_pretty_fallback_to_vertical_max_rows_per_chunk
Vertical形式へのフォールバック(output_format_pretty_fallback_to_vertical
を参照)は、チャンク内のレコード数が指定された値を超えない場合にのみ有効になります。
output_format_pretty_fallback_to_vertical_min_columns
Vertical形式へのフォールバック(output_format_pretty_fallback_to_vertical
を参照)は、カラム数が指定された値を超える場合のみ有効になります。
output_format_pretty_fallback_to_vertical_min_table_width
Vertical形式へのフォールバック(output_format_pretty_fallback_to_vertical
を参照)は、テーブル内のカラムの長さの合計が指定された値以上であるか、少なくとも1つの値が改行文字を含む場合にのみ有効になります。
output_format_pretty_glue_chunks
Pretty形式で表示されたデータが複数のチャンクに分かれて到着した場合、次のチャンクが前のチャンクと同じカラム幅を持つ場合、ANSIエスケープシーケンスを使用して前の行に戻り、前のチャンクのフッターを上書きして新しいチャンクのデータで続けます。これにより、結果が視覚的により魅力的になります。
0 - 無効、1 - 有効、'auto' - ターミナルの場合に有効。
output_format_pretty_grid_charset
グリッドボーダーを印刷するための文字セット。利用可能な文字セット: ASCII、UTF-8(デフォルト)。
output_format_pretty_highlight_digit_groups
有効にすると、出力がターミナルの場合、千の位、百万の位に対応するすべての数字に下線を引きます。
output_format_pretty_highlight_trailing_spaces
有効にすると、出力がターミナルの場合、末尾の空白を灰色にハイライトし、下線を引きます。
output_format_pretty_max_column_name_width_cut_to
カラム名が長すぎる場合、この長さに切り詰めます。
カラムは、output_format_pretty_max_column_name_width_cut_to
に加えて output_format_pretty_max_column_name_width_min_chars_to_cut
より長い場合に切り詰められます。
output_format_pretty_max_column_name_width_min_chars_to_cut
カラム名が長すぎる場合に切り取る最小文字数。
カラムは、output_format_pretty_max_column_name_width_cut_to
に加えて output_format_pretty_max_column_name_width_min_chars_to_cut
より長い場合に切り詰められます。
output_format_pretty_max_column_pad_width
Pretty形式でカラム内のすべての値をパディングする最大幅。
output_format_pretty_max_rows
Pretty形式の行数制限。
output_format_pretty_max_value_width
Pretty形式で表示する値の最大幅。これを超える場合は切り詰めます。 値0は、決して切り詰めないことを意味します。
output_format_pretty_max_value_width_apply_for_single_value
ブロック内に単一の値しかない場合に限り、値を切り詰めます(output_format_pretty_max_value_width
設定を参照)。それ以外は完全に出力され、SHOW CREATE TABLE
クエリに便利です。
output_format_pretty_multiline_fields
有効にすると、Pretty形式はテーブルセル内でマルチラインフィールドをレンダリングし、テーブルのアウトラインが保持されます。 無効の場合はそのままレンダリングされ、テーブルが変形する可能性があります(オフにすることで、マルチライン値のコピー&ペーストが簡単になる利点があります)。
output_format_pretty_row_numbers
Pretty出力形式の各行の前に行番号を追加します。
output_format_pretty_single_large_number_tip_threshold
この値を超える単一の数値で構成されるブロックがある場合、テーブルの右側に可読性のある数値のヒントを印刷します(0を除く)。
output_format_pretty_squash_consecutive_ms
指定されたミリ秒数まで次のブロックを待機し、書き込み前に前のブロックに圧縮します。 これにより、非常に小さなブロックの出力が頻繁に発生するのを避けつつ、データをストリーミング形式で表示できるようになります。
output_format_pretty_squash_max_wait_ms
前の出力から指定されたミリ秒数が経過した場合、保留中のブロックをPretty形式で出力します。
output_format_protobuf_nullables_with_google_wrappers
Googleラッパーを使用してNullableカラムをシリアライズする際、デフォルト値を空のラッパーとしてシリアライズします。オフにすると、デフォルトおよびnull値はシリアライズされません。
output_format_schema
自動生成されたスキーマがCap'n ProtoまたはProtobuf形式で保存されるファイルのパス。
output_format_sql_insert_include_column_names
INSERTクエリにカラム名を含める
output_format_sql_insert_max_batch_size
1つのINSERT文での最大行数。
output_format_sql_insert_quote_names
カラム名を '`' 文字で引用する。
output_format_sql_insert_table_name
出力INSERTクエリ内のテーブル名。
output_format_sql_insert_use_replace
INSERTの代わりにREPLACE文を使用する。
output_format_tsv_crlf_end_of_line
trueに設定されている場合、TSV形式の行末は\r\nになります。
output_format_values_escape_quote_with_quote
trueの場合、'を''でエスケープし、そうでなければ\で引用します。
output_format_write_statistics
読み取った行、バイト、経過時間についての統計を適切な出力形式で書き出します。
デフォルトで有効です。
precise_float_parsing
より正確ですが遅い浮動小数点解析アルゴリズムを優先します。
regexp_dict_allow_hyperscan
Hyperscanライブラリを使用してregexp_tree辞書を許可します。
regexp_dict_flag_case_insensitive
regexp_tree辞書のケースインセンシティブマッチングを使用します。個別の式で(?i)および(?-i)を使って上書きできます。
regexp_dict_flag_dotall
regexp_tree辞書のために'.'が改行文字に一致することを許可します。
rows_before_aggregation
有効な場合、ClickHouseはrows_before_aggregation統計の正確な値を提供し、集約前に読み込まれた行数を示します。
schema_inference_hints
スキーマ推論のためのヒントとして使用するカラム名と型のリスト。
例:
クエリ:
結果:
schema_inference_hints
が正しくフォーマットされていない場合、またはタイプミスや誤ったデータ型などがある場合...全体のschema_inference_hintsは無視されます。
schema_inference_make_columns_nullable
スキーマ推論で推測した型をNullable
にするかどうかを制御します。
可能な値:
- 0 - 推測された型は決して
Nullable
にならない(この場合、null値に対して何をするかはinput_format_null_as_defaultで制御します)、 - 1 - すべての推測された型は
Nullable
になります、 - 2 または
auto
- 推測された型は、スキーマ推論中に解析されたサンプルにNULL
が含まれている場合、またはファイルメタデータにカラムのnullabilityについての情報が含まれている場合にのみNullable
になります、 - 3 - 推測された型のnullabilityは、フォーマットにその情報が含まれている場合(例:Parquet)にはファイルメタデータに一致し、それ以外の場合は常にNullableになります(例:CSV)。
schema_inference_make_json_columns_nullable
スキーマ推論で推測したJSON型をNullable
にするかどうかを制御します。
この設定がschema_inference_make_columns_nullableとともに有効な場合、推測されたJSON型はNullable
になります。
schema_inference_mode
スキーマ推論モード。 'default' - すべてのファイルが同じスキーマを持つと仮定し、スキーマは任意のファイルから推測できる、 'union' - ファイルが異なるスキーマを持つことができ、結果のスキーマはすべてのファイルのスキーマの和であるべきです。
show_create_query_identifier_quoting_rule
SHOW CREATEクエリの識別子に対する引用ルールを設定します。
show_create_query_identifier_quoting_style
SHOW CREATEクエリの識別子に対する引用スタイルを設定します。
type_json_skip_duplicated_paths
有効にすると、JSONオブジェクトをJSON型に解析する際に重複したパスが無視され、最初のもののみが挿入されます(例外ではありません)。
validate_experimental_and_suspicious_types_inside_nested_types
Array/Map/Tupleのようなネストされた型内の実験的および疑わしい型の使用を検証します。