本文說明 Dataplex Universal Catalog 關鍵字搜尋和自然語言 AI 搜尋的語法。
Dataplex Universal Catalog 可讓您探索、集中編目、管理及瞭解機構的資料。如要有效率地在資料目錄中找出特定資料資產,可以使用功能強大的搜尋查詢。搜尋查詢的語法包括:
- 簡單搜尋:如何使用單一搜尋字詞尋找資料資產。
- 合格述詞:如何使用特定中繼資料欄位 (例如名稱、位置或說明) 縮小搜尋範圍。
- 切面搜尋:如何根據附加的業務和技術中繼資料搜尋項目。
- 邏輯運算子:如何使用 AND 和 OR 結合多個搜尋條件,建立複雜的查詢。瞭解這項語法後,就能快速找到所需資料。
事前準備
瞭解 Dataplex Universal Catalog 項目群組、項目、項目連結、切面、項目類型、項目連結類型和切面類型。請參閱「關於 Dataplex Universal Catalog 中的中繼資料管理」。
Dataplex Universal Catalog 提供兩種搜尋模式:關鍵字搜尋和自然語言搜尋。
- 關鍵字搜尋功能可讓您使用特定關鍵字、篩選條件和定義的語法尋找資源。
- 自然語言搜尋會運用 AI 理解語意搜尋查詢,您可以使用日常用語尋找資源,不必再使用複雜的語法。
本文涵蓋關鍵字和自然語言搜尋的語法。
如要在Google Cloud 控制台中啟動 Dataplex Universal Catalog 搜尋查詢,請前往 Dataplex Universal Catalog 的「Search」(搜尋) 頁面,然後選取「Dataplex Universal Catalog」做為搜尋平台。
詳情請參閱「在 Dataplex Universal Catalog 中搜尋資源」。
任意文字搜尋
輸入字詞或詞組即可尋找資產,不必使用任何特定語法。 Dataplex Universal Catalog 會比對查詢與多個中繼資料欄位,包括:
- 資源的名稱、顯示名稱或說明
- 資源類型
- 專案 ID
- 總覽說明
- 資源結構定義中的資料欄名稱 (或巢狀資料欄名稱)
- 資料欄說明
- 完整名稱
- 聯絡人
- 切面
使用查詢語法搜尋
如要進行更精確的搜尋,可以使用特定語法建構查詢,包括限定符、邏輯運算子和面向搜尋。
限定述詞
您可以限定述詞,方法是在述詞前面加上一個鍵,藉此將比對作業限制於中繼資料的特定部分:
- 等號 (
=) 可將搜尋範圍限制為完全比對。 - 鍵後方的半形冒號 (
:) 會將述詞比對至搜尋結果值中的子字串或符記。
符記化會將一段文字串流拆解為一連串符記,一個符記通常會對應至一個字詞。
例如:
name:foo會選取名稱包含foo子字串的資源,例如foo1和barfoo。description:foo會選取說明中含有foo權杖的資源,例如bar和foo。location=foo會比對指定位置中的資源與foo(位置名稱)。
這些限定符的行為在不同搜尋模式中可能會略有差異,詳情請參閱下列章節。
關鍵字搜尋
述詞鍵 type、system、location 和 orgid 僅支援完全比對 (=) 限定詞,不支援子字串限定詞 (:)。舉例來說,type=foo 或 orgid=number。
Dataplex Universal Catalog 支援下列關鍵字搜尋限定詞:
| 限定詞 | 說明 |
|---|---|
name:x |
將 x 做為資源 ID 的子字串比對。 |
displayname:x |
將 x 做為資源顯示名稱的子字串比對。 |
column:x |
將 x 做為資源結構定義中資料欄名稱 (或巢狀資料欄名稱) 的子字串比對。 |
description:x |
將 x 做為資源說明中的符記比對。 |
label:bar |
符合具有標籤 (具有某些值) 的 BigQuery 資源,且標籤鍵包含 bar 做為子字串。 |
label=bar |
比對具有標籤 (含某些值) 的 BigQuery 資源,且標籤鍵等於 bar 字串。 |
label:bar:x |
比對 BigQuery 資源所附加標籤 (鍵為 bar) 值中的子字串 x。 |
label=foo:bar |
比對鍵等於 foo 且鍵值等於 bar 的 BigQuery 資源。 |
label.foo=bar |
比對鍵等於 foo 且鍵值等於 bar 的 BigQuery 資源。 |
label.foo |
比對標籤鍵等於 foo (以字串形式) 的 BigQuery 資源。 |
type=TYPE |
比對特定項目類型或類型別名的資源。 |
projectid:bar |
比對 Google Cloud 專案中的資源,這些專案的 ID 包含 bar 做為子字串。 |
parent:x |
比對 x 是否為資源階層式路徑的子字串。父項路徑是父項資源的 fully_qualified_name。 |
orgid=number |
符合 ID 值為 number 的 Google Cloud 機構中的資源。 |
system=SYSTEM |
比對指定系統的資源。 |
location=LOCATION |
在指定位置中,尋找名稱完全相符的資源。
舉例來說, BigQuery Omni 資產支援這項限定符,方法是使用 BigQuery Omni 位置名稱。舉例來說,
|
createtime |
尋找在指定日期/時間之前、之後或期間建立的資源。 例如:
時間戳記格式: 所有時間戳記必須採用 GMT,系統不支援時區。支援部分時間戳記、連字號 ( 例如:
|
updatetime |
尋找在指定日期/時間內、之前或之後更新的資源。 例如:
時間戳記格式: 所有時間戳記必須採用 GMT,系統不支援時區。支援部分時間戳記、連字號 ( 例如:
|
fully_qualified_name:x |
x 與 fully_qualified_name 的子字串相符。 |
fully_qualified_name=x |
與 x 相符,如 fully_qualified_name。 |
自然語言搜尋
述詞鍵 type、system、location 和 description,以及面向搜尋 (不含 has) 僅支援完全比對 (=) 限定詞,不支援子字串限定詞 (:)。例如 type=foo。
Dataplex Universal Catalog 支援下列自然語言搜尋限定詞:
| 限定詞 | 說明 |
|---|---|
name:x |
將 x 做為資源 ID 或資源顯示名稱的子字串比對。 |
displayname:x |
將 x 做為資源顯示名稱的子字串比對。 |
column:x |
將 x 做為資源結構定義中資料欄名稱 (或巢狀資料欄名稱) 的子字串比對。 |
description:x |
將 x 做為資源說明中的符記比對。 |
labels:bar |
符合具有標籤 (具有某些值) 的 BigQuery 資源,且標籤鍵包含 bar 做為子字串。 |
labels=bar |
比對具有標籤 (含某些值) 的 BigQuery 資源,且標籤鍵等於 bar 字串。 |
labels.bar:x |
比對 BigQuery 資源所附加標籤 (鍵為 bar) 值中的子字串 x。 |
labels.foo=bar |
比對鍵等於 foo 且鍵值等於 bar 的 BigQuery 資源。 |
type=TYPE |
比對特定項目類型或類型別名的資源。 |
projectid:bar |
比對 Google Cloud 專案中的資源,這些專案的 ID 包含 bar 做為子字串。 |
parent:x |
將 x 比對為資源階層式路徑的子字串。 |
system=SYSTEM |
比對指定系統的資源。 |
location=LOCATION |
在指定位置中,尋找名稱完全相符的資源。
舉例來說, BigQuery Omni 資產支援這項限定符,方法是使用 BigQuery Omni 位置名稱。舉例來說,
|
createtime |
尋找在指定日期/時間之前、之後或期間建立的資源。 例如:
時間戳記格式: 所有時間戳記必須採用 GMT,系統不支援時區。支援部分時間戳記、連字號 ( 例如:
|
updatetime |
尋找在指定日期/時間內、之前或之後更新的資源。 例如:
時間戳記格式: 所有時間戳記必須採用 GMT,系統不支援時區。支援部分時間戳記、連字號 ( 例如:
|
切面搜尋
如要根據附加的面向搜尋項目,請使用下列查詢語法。
關鍵字搜尋
| 限定詞 | 說明 |
|---|---|
aspect:x |
以附加至項目的構面類型完整路徑的子字串形式比對 x,格式為 projectid.location.ASPECT_TYPE_ID |
aspect=x |
比對 x,做為附加至項目的構面類型完整路徑,格式為 projectid.location.ASPECT_TYPE_ID |
aspect:xOPERATORvalue |
搜尋顯示比例欄位值。比對 支援的運算子清單取決於層面中的欄位類型,如下所示:
只有層面頂層欄位可供搜尋。 舉例來說,下列所有查詢都會比對項目,其中
|
自然語言搜尋
| 限定詞 | 說明 |
|---|---|
has:x |
以附加至項目的構面類型完整路徑的子字串形式比對 x,格式為 projectid.location.ASPECT_TYPE_ID |
has=x |
比對 x,做為附加至項目的構面類型完整路徑,格式為 projectid.location.ASPECT_TYPE_ID |
xOPERATORvalue |
搜尋顯示比例欄位值。與附加至項目的層面類型和層面欄位名稱的完整路徑相符,格式如下:
只有層面頂層欄位可供搜尋。 |
邏輯運算子
查詢可能包含多個述詞與邏輯運算子。如果未指定運算子,則默示使用邏輯 AND。舉例來說,foo bar 會傳回同時符合 foo 述詞和 bar 述詞的資源。
系統支援邏輯 AND 和邏輯 OR。例如:foo OR bar。
您可以使用 - (連字號) 或 NOT 前置字串否定述詞。例如,-name:foo 會傳回名稱與 foo 述詞不符的資源。
縮寫語法
您也可以使用簡寫搜尋語法,以 | (垂直線) 代表 OR 運算子,並以 , (逗號) 代表 AND 運算子。
舉例來說,如要使用 OR 運算子搜尋多個專案中的項目,可以使用下列簡短語法:
projectid:(id1|id2|id3|id4)
如果沒有使用縮寫語法,相同的搜尋查詢如下所示:
projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4
如要搜尋資料欄名稱相符的項目,請使用下列方式:
- AND:
column:(name1,name2,name3) - OR:
column:(name1|name2|name3)
這個簡短語法適用於合格述詞,但關鍵字搜尋中的 label 除外。
後續步驟
- 瞭解如何在 Dataplex Universal Catalog 中搜尋資源
- 進一步瞭解 Dataplex Universal Catalog 的中繼資料管理功能。
- 瞭解如何使用構面,透過中繼資料擴充項目和項目連結。
- 瞭解如何管理項目及擷取自訂來源。