Este documento descreve como usar o arquivo de atributos do catálogo universal do Dataplex.
Migre da loja de atributos para etiquetas e condições da IAM
Para migrar da Attribute Store, substitui a funcionalidade da Attribute Store por etiquetas, etiquetas de políticas e condições da IAM.
Para conjuntos de dados e tabelas do BigQuery, faça o seguinte:
- Crie uma etiqueta que replique o atributo do Dataplex Universal Catalog. Para mais informações, consulte Criar e definir uma nova etiqueta.
- Anexe a etiqueta ao conjunto de dados ou à tabela do BigQuery. Para mais informações, consulte os artigos Anexe etiquetas a um conjunto de dados existente e Anexe etiquetas a uma tabela existente.
- Crie uma condição do IAM para gerir o acesso ao conjunto de dados ou à tabela com base na etiqueta. Para mais informações, consulte o artigo Controle o acesso com as condições da IAM.
Para colunas do BigQuery, faça o seguinte:
- Crie uma etiqueta de política no BigQuery que replique o atributo do catálogo universal do Dataplex.
- Defina a etiqueta de política na coluna.
- Use a etiqueta de política para gerir o acesso à coluna através do controlo de acesso ao nível da coluna ou da ocultação dinâmica de dados.
Para mais informações, consulte os artigos Introdução ao controlo de acesso ao nível da coluna e Configure o controlo de acesso ao nível da coluna.
Vista geral da loja de atributos
O Dataplex Universal Catalog Attribute Store é uma infraestrutura extensível que lhe permite especificar comportamentos relacionados com políticas nos recursos associados. Os administradores do catálogo universal do Dataplex podem usar o arquivo de atributos para definir como determinados dados devem ser tratados, associando dados a atributos.
Com o Attribute Store, pode adicionar vários atributos a um objeto, como uma coluna. O repositório de atributos une os comportamentos de todos os atributos associados a um objeto e apresenta-o como uma única política no recurso subjacente.
Pode definir atributos para conjuntos de dados publicados. Os conjuntos de dados publicados referem-se aos conjuntos de dados criados pelo Dataplex Universal Catalog a partir das tabelas descobertas num recurso de contentor.
Os seguintes comportamentos de políticas são suportados:
- Especificações de recursos: especifica o acesso a um recurso, como uma tabela
- Especificações de colunas: especifica o acesso a uma coluna numa tabela do BigQuery
Pode usar a loja de atributos para definir uma hierarquia de atributos denominada taxonomia. Numa taxonomia, um atributo secundário herda as especificações da hierarquia de atributos principais. As especificações do principal e do secundário são unidas numa lista unificada, que é propagada para o recurso.
Pode usar a loja de atributos do Dataplex Universal Catalog para fazer o seguinte:
- Crie taxonomias.
- Crie atributos e organize-os numa hierarquia.
- Associe um ou mais atributos a tabelas.
- Associe um ou mais atributos a colunas.
Terminologia
Esta secção descreve a terminologia usada neste documento.
Taxonomia de atributos
Uma taxonomia de dados é uma hierarquia de atributos. Numa taxonomia, os atributos nos nós principais permitem que os atributos abaixo deles (atributos secundários) herdem e adicionem as especificações de comportamento dos atributos principais aos seus próprios.
Por exemplo:
Se um atributo denominado PII
tiver uma especificação de recurso group-a@company.com
e um atributo secundário de PII
denominado Social Security numbers
tiver uma especificação de recurso group-b@company.com
, então as especificações de recurso aplicadas às políticas onde o atributo Social Security numbers
está associado serão group-a@company.com
e group-b@company.com
.
Quando define um atributo, pode escolher se é um atributo principal ou secundário. Quando define um atributo secundário, tem de especificar o respetivo atributo principal.
Especificações das colunas
As especificações de comportamento das colunas. Especifica as pessoas ou os grupos que têm acesso de leitura às colunas. Se associar um atributo que contenha uma especificação de coluna à coluna de uma tabela, adiciona uma etiqueta de política de coluna do BigQuery a essa coluna.
Especificações dos recursos
As autorizações para pessoas ou grupos acederem a recursos (tabelas). Se associar um atributo à especificação de recursos, o catálogo universal do Dataplex propaga as funções da IAM aos utilizadores especificados para acederem às tabelas associadas ao atributo.
Antes de começar
Limitações
O Dataplex Universal Catalog propaga as políticas de especificação de colunas como etiquetas de políticas do BigQuery. O BigQuery tem uma limitação de uma etiqueta de política por coluna. Se já existir uma etiqueta de política numa coluna, o catálogo universal do Dataplex gera um erro no registo de governação no separador Gerir.
Quotas
Seguem-se as quotas e os limites que se aplicam ao Attribute Store do Dataplex Universal Catalog:
Limite | Predefinição |
---|---|
Número máximo de taxonomias numa região | 100 |
Número máximo de atributos em todas as taxonomias numa região | 10 000 |
Número máximo de atributos que podem ser associados a um recurso (tabela) | 50 |
Número máximo de atributos que podem ser associados a uma coluna | 100 |
Profundidade máxima por árvore de atributos de dados numa taxonomia de atributos | 4 |
Funções necessárias
Para receber as autorizações de que precisa para usar o arquivo de atributos do catálogo universal do Dataplex, peça ao seu administrador que lhe conceda as seguintes funções de IAM no projeto:
-
Faça a gestão de taxonomias e atributos:
Administrador da taxonomia do Dataplex (
roles/dataplex.taxonomyAdmin
) -
Veja as associações associadas a recursos e atributos:
Visualizador de taxonomia do Dataplex (
roles/dataplex.taxonomyViewer
) -
Crie e faça a gestão de recursos de associação num projeto:
-
Dataplex Binding Admin (
roles/dataplex.bindingAdmin
) -
Administrador do Dataplex (
roles/dataplex.admin
no recurso de zona)
-
Dataplex Binding Admin (
-
Faça a gestão das especificações de acesso a recursos e dados:
Administrador de segurança do Dataplex (
roles/dataplex.securityAdmin
)
Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.
Estas funções predefinidas contêm as autorizações necessárias para usar o arquivo de atributos do Dataplex Universal Catalog. Para ver as autorizações exatas que são necessárias, expanda a secção Autorizações necessárias:
Autorizações necessárias
São necessárias as seguintes autorizações para usar o arquivo de atributos do Dataplex Universal Catalog:
-
Faça a gestão de taxonomias e atributos:
-
dataplex.datataxonomies.*
-
dataplex.dataattributes.*
(exceptdataplex.dataattributes.configureResourceAccess
anddataplex.dataattributes.configureDataAccess
)
-
-
Veja as associações associadas a recursos e atributos:
-
dataplex.datataxonomies.get
-
dataplex.datataxonomies.list
-
dataplex.dataattributes.get
-
dataplex.dataattributes.list
-
dataplex.dataattributebindings.get
-
dataplex.dataattributebindings.list
-
-
Crie e faça a gestão de recursos de associação num projeto:
dataplex.dataattributebindings.*
-
Faça a gestão das especificações de acesso aos recursos e dados:
-
dataplex.datataxonomies.configureResourceAccess
-
dataplex.datataxonomies.configureDataAccess
-
Também pode conseguir estas autorizações com funções personalizadas ou outras funções predefinidas.
Exemplos de utilização
Considere uma empresa denominada ACME
que tem três tipos de dados:
Red
dados confidenciaisGreen
dados restritos, mas menos confidenciais- Dados sem categoria
O administrador do Dataplex Universal Catalog de ACME
cria o seguinte conjunto de atributos:
Atributo:
Red
- Especificações das colunas:
secrets_team@acme
com autorização de leitura - Especificações de recursos:
secrets_team@acme
etenured_employees@acme
com autorização de leitura
- Especificações das colunas:
Atributo:
Green
- Especificações das colunas:
full_time_employees@acme
com autorização de leitura - Especificações de recursos:
full_time_employees@acme
com autorização de edição
- Especificações das colunas:
Os atributos Red
e Green
controlam o comportamento de acesso aos recursos (tabelas) consoante os atributos associados às tabelas e às respetivas colunas.
Considere uma tabela com as seguintes colunas:
- ID
- Código postal
- Nome
- Morada
- $Value
Exemplo de utilização 1: associar o mesmo atributo à tabela e a uma coluna
Se associar o atributo Red
à tabela e à respetiva coluna Nome,
o catálogo universal do Dataplex propaga as seguintes políticas:
- Os funcionários em
secrets_team@acme
etenured_employees@acme
podem ler a tabela, ver os respetivos metadados e consultá-la. - Apenas os funcionários em
secrets_team@acme
podem consultar a coluna Name, uma vez que está mais protegida pelas especificações das colunas.
Exemplo de utilização 2: combine atributos
Considere as seguintes associações:
- Associe os atributos
Red
eGreen
à tabela. - Associe os atributos
Red
eGreen
à coluna Nome. - Associe o atributo
Red
à coluna $Value.
Neste caso, o Dataplex Universal Catalog propaga as seguintes políticas:
- Os funcionários em
secrets_team@acme
,tenured_employees@acme
efull_time_employees@acme
podem aceder à tabela. Isto deve-se ao facto de o Dataplex Universal Catalog unir as especificações de recursos dos atributosRed
eGreen
. - Os funcionários em
secrets_team@acme
efull_time_employees@acme
podem aceder à coluna Nome. Isto deve-se ao facto de o Dataplex Universal Catalog unir as especificações das colunas dos atributosRed
eGreen
. - Apenas os funcionários em
secrets_team@acme
podem consultar a coluna $Value.
Exemplo de utilização 3: organize os atributos numa hierarquia
Pode organizar os atributos numa hierarquia especificando os subtipos de atributos. Considere o seguinte conjunto de atributos:
Atributo principal 1:
Atributo: PII
- Especificações da coluna:
secrets_team@acme
- Especificações do recurso:
secrets_team@acme
etenured_employees@acme
Atributo filho de PII
:
Atributo: Email
- Especificações da coluna:
email_comm@acme
- Especificações de recursos:
email_comm@acme
Parent attribute 2:
Attribute: Financial
- Especificações da coluna:
full_time_employees@acme
- Especificações de recursos:
full_time_employees@acme
Considere as seguintes associações:
- Associe os atributos
Email
eFinancial
à tabela. - Associe os atributos
Email
eFinancial
à coluna Nome. - Associe o atributo
PII
à coluna $Value.
Neste caso, o Dataplex Universal Catalog propaga as seguintes políticas:
- Os funcionários em
secrets_team@acme
,tenured_employees@acme
,full_time_employees@acme
eemail_comm@acme
podem aceder à tabela. Isto deve-se ao facto de o Dataplex Universal Catalog unir as especificações de recursos dos atributosFinancial
eEmail
, e o atributoEmail
herda as especificações do atributoPII
. - Os funcionários em
secrets_team@acme
,email_comm@acme
efull_time_employees@acme
podem aceder à coluna Nome. Isto deve-se ao facto de o Dataplex Universal Catalog unir as especificações das colunas dos atributosFinancial
eEmail
. - Apenas os funcionários em
secrets_team@acme
podem consultar a coluna $Value.
Configure atributos
Para criar um atributo, primeiro tem de criar uma taxonomia e, em seguida, criar os atributos de dados principais e secundários.
Crie uma taxonomia de atributos de dados
Na Google Cloud consola, aceda à página Attribute Store do catálogo universal do Dataplex.
Clique em Criar taxonomia.
Introduza o Nome da taxonomia, o ID e a Descrição.
Selecione uma região.
Clique em Enviar.
A nova taxonomia é apresentada na página Taxonomias de dados.
Crie um atributo principal
Na Google Cloud consola, aceda à página Attribute Store do catálogo universal do Dataplex.
Na página Taxonomias de dados, clique na taxonomia na qual quer criar o atributo principal.
Na página Detalhes da taxonomia, clique em Adicionar atributo de dados.
Selecione Criar atributo de dados principal.
Introduza um nome, um ID e uma descrição para o atributo principal.
Opcional: configure as especificações dos atributos.
Configure as especificações de recursos:
- Clique em Gerir autorizações para Recurso.
- Clique em Adicionar.
- No campo Novos membros, introduza o endereço de email de uma pessoa ou de um grupo que precisa de acesso ao recurso.
- Selecione as Funções necessárias e clique em Guardar.
- Clique em Guardar.
Configure as especificações das colunas:
- Clique em Gerir autorizações para Coluna.
- Clique em Adicionar.
- No campo Novos responsáveis, introduza o endereço de email de uma pessoa ou de um grupo que precisa de acesso à coluna.
- Selecione as Funções necessárias e clique em Guardar.
- Clique em Guardar.
Clique em Criar.
Crie um atributo filho
Na Google Cloud consola, aceda à página Attribute Store do catálogo universal do Dataplex.
Na página Taxonomias de dados, clique na taxonomia na qual quer criar o atributo secundário.
Na página Detalhes da taxonomia, clique em Adicionar atributo de dados.
Selecione Criar atributo de dados filho.
Selecione um atributo de dados principal para o atributo filho que está a criar.
Introduza um nome, um ID e uma descrição para o atributo secundário.
Opcional: configure as especificações dos atributos.
Configure as especificações de recursos:
- Clique em Gerir autorizações para Recurso.
- Clique em Adicionar.
- No campo Novos membros, introduza o endereço de email de uma pessoa ou de um grupo que precisa de acesso ao recurso.
- Selecione as Funções necessárias e clique em Guardar.
- Clique em Guardar.
Configure as especificações das colunas:
- Clique em Gerir autorizações para Coluna.
- Clique em Adicionar.
- No campo Novos responsáveis, introduza o endereço de email de uma pessoa ou de um grupo que precisa de acesso à coluna.
- Selecione as Funções necessárias e clique em Guardar.
- Clique em Guardar.
Clique em Criar.
Atualize os recursos da loja de atributos
Atualize os detalhes da taxonomia
Na Google Cloud consola, aceda à página Attribute Store do catálogo universal do Dataplex.
Clique na taxonomia que quer atualizar.
Clique em Edit.
Edite o nome da taxonomia e a respetiva descrição, conforme necessário.
Clique em Enviar.
Atualize os detalhes dos atributos
Na Google Cloud consola, aceda à página Attribute Store do catálogo universal do Dataplex.
Clique na taxonomia que contém o atributo que quer atualizar.
Clique no atributo que quer atualizar.
Para atualizar o nome e a descrição do atributo, clique em Editar.
- Se estiver a atualizar um atributo principal, tem a opção de o atualizar para um atributo secundário e vice-versa. Selecione as opções em conformidade.
- Edite o nome do atributo e a respetiva descrição, conforme necessário.
- Clique em Atualizar.
Para atualizar as especificações de recursos do atributo, clique em
Editar para Especificações de recursos.Para adicionar um novo diretor, siga estes passos:
- Clique em Adicionar.
- No campo Novos membros, introduza o endereço de email de uma pessoa ou de um grupo que precise de acesso ao recurso.
- Selecione as Funções necessárias.
- Clique em Guardar.
Para atualizar um principal existente, siga estes passos:
- Para o principal que quer atualizar, clique em Editar.
- Selecione as Funções necessárias.
- Clique em Guardar.
Para remover um principal existente, siga estes passos:
- Selecione o diretor que quer remover.
- Clique em Remover.
Para atualizar as especificações das colunas do atributo, clique em
Editar para Especificações das colunas.Para adicionar um novo diretor, siga estes passos:
- Clique em Adicionar.
- No campo Novos membros, introduza o endereço de email de uma pessoa ou de um grupo que precisa de acesso à coluna.
- Selecione as Funções necessárias.
- Clique em Guardar.
Para atualizar um principal existente, siga estes passos:
- Para o principal que quer atualizar, clique em Editar.
- Selecione as Funções necessárias.
- Clique em Guardar.
Para remover um principal existente, siga estes passos:
- Selecione o diretor que quer remover.
- Clique em Remover.
Associe atributos a recursos
Associe um atributo a uma tabela
Na Google Cloud consola, aceda à página Attribute Store do catálogo universal do Dataplex.
Clique na taxonomia que contém o atributo.
Clique no atributo ao qual quer associar uma tabela.
Clique no separador Recursos.
Clique em Adicionar recursos.
Selecione uma tabela na lista.
Clique em Selecionar.
Associe um atributo a uma coluna
Na Google Cloud consola, aceda à página Pesquisa do catálogo de dados.
Pesquise e selecione a tabela à qual quer associar um atributo a uma coluna.
Clique no separador Esquema e etiquetas de colunas.
Para a coluna à qual quer associar um atributo, em Etiquetas de políticas, clique em
Adicionar.Selecione a taxonomia que contém o atributo.
Selecione o atributo.
Clique em Anexar.
O que se segue?
- Saiba mais sobre a segurança do Dataplex Universal Catalog.
- Saiba mais acerca da gestão de políticas no Dataplex Universal Catalog.
- Saiba mais sobre as funções de IAM do Dataplex Universal Catalog.