Normalização

Para muitos campos suportados específicos, o Document AI também devolve um entity.normalizedValue além do campo extraído não processado obtido através do textAnchor de cada entidade. Normaliza o texto literal. A normalização divide frequentemente o valor de texto em subcampos.

Estes contêm os dados num formato padronizado para reduzir o pós-processamento e permitir a conversão para qualquer formato selecionado. O mentionText, que representa o que está literalmente no documento, nunca é alterado pela normalização.

Os campos normalizados pertencem a uma das seguintes categorias.

Valores normalizados na consola

Na Google Cloud consola, os campos normalizados são anotados com G. Por exemplo:

enriquecimento
Exemplo de campo normalizado apresentado na aplicação Web.

Processadores suportados

Seguem-se os processadores e os campos que suportam o enriquecimento e a normalização de entidades:

Processadores Campos normalizados

Analisador de extratos de conta

Categoria Pré-treinado
Tipo de solução Empréstimos
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Detalhes completos do processador Entrada detalhada
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date

Analisador de passaportes dos EUA

Categoria Pré-treinado
Tipo de solução Identidade
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Detalhes completos do processador Entrada detalhada
  • Date Of Birth
  • Expiration Date
  • Issue Date

Analisador de utilitários

Categoria Pré-treinado
Tipo de solução Aprovisionamento
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Limitado
Detalhes completos do processador Entrada detalhada
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount

Analisador de validação de documentos de identificação

Categoria Pré-treinado
Tipo de solução Identidade
Funções OCR, análise de qualidade
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Detalhes completos do processador Entrada detalhada
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words

Analisador de recibos de pagamento

Categoria Pré-treinado
Tipo de solução Empréstimos
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Detalhes completos do processador Entrada detalhada
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd

Analisador de cartas de condução dos EUA

Categoria Pré-treinado
Tipo de solução Identidade
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Detalhes completos do processador Entrada detalhada
  • Date Of Birth
  • Expiration Date
  • Issue Date

Analisador de despesas

Categoria Pré-treinado
Tipo de solução Aprovisionamento
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Detalhes completos do processador Entrada detalhada
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount

Analisador de faturas

Categoria Pré-treinado
Tipo de solução Aprovisionamento
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Detalhes completos do processador Entrada detalhada
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate

Processadores de extração

O extrator personalizado suporta a normalização de todas as entidades com os seguintes Google Cloud tipos de dados comuns: dateTime, currency, money e number.

Processadores Tipos de dados normalizados

Extrator personalizado

Categoria Extrair
Tipo de solução Personalizado
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Detalhes completos do processador Entrada detalhada
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER