Puoi configurare Vertex AI per il peering con Virtual Private Cloud (VPC) per connetterti direttamente a determinate risorse in Vertex AI, tra cui:
- Addestramento personalizzato
- Condivisioni NFS per l'addestramento personalizzato
- Endpoint privati di inferenza
- Ray on Vertex AI
- Query online di corrispondenza vettoriale
- Pipelines
Questa guida mostra come configurare il peering di rete VPC per il peering della rete con le risorse Vertex AI. Questa guida è consigliata agli amministratori di rete che hanno già familiarità con Google Cloud i concetti di rete.
Panoramica
Questa guida illustra le seguenti attività:
- Configura l'accesso privato ai servizi per il VPC. In questo modo viene stabilita una connessione in peering tra il tuo VPC e la rete VPC condivisa di Google.
- Considera l'intervallo IP che devi riservare per Vertex AI.
- Se applicabile, esporta le route personalizzate in modo che Vertex AI possa importarle.
Prima di iniziare
- Seleziona un VPC di cui vuoi eseguire il peering con le risorse Vertex AI. È possibile eseguire il peering di Vertex AI con una sola rete per regione alla volta.
- Seleziona o crea un Google Cloud progetto da utilizzare per Vertex AI.
-
Verifica che la fatturazione sia abilitata per il tuo Google Cloud progetto.
Abilita le API Compute Engine, Vertex AI e Service Networking.
Ruoli richiesti per abilitare le API
Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo servizi (
roles/serviceusage.serviceUsageAdmin), che contiene l'autorizzazioneserviceusage.services.enable. Scopri come concedere i ruoli.- Facoltativamente, puoi utilizzare il VPC condiviso. Se utilizzi il VPC condiviso, in genere utilizzi Vertex AI in un progetto diverso Google Cloud dal progetto host del VPC. Abilita le API Compute Engine e Service Networking in entrambi i progetti. Scopri come eseguire il provisioning del VPC condiviso.
- Installa gcloud CLI se vuoi eseguire gli
gcloudesempi in questa guida.
Ruoli obbligatori
Se non sei il proprietario o l'editor di un progetto, assicurati di disporre del
ruolo Amministratore rete Compute
(roles/compute.networkAdmin), che
include i ruoli richiesti per gestire le risorse di rete.
Peering con una rete on-premise
Per il peering di rete VPC con una rete on-premise, sono necessari passaggi aggiuntivi:
- Connetti la rete on-premise al VPC. Puoi utilizzare un tunnel VPN o Interconnect.
- Configura le route personalizzate dal VPC alla rete on-premise.
- Esporta le route personalizzate in modo che Vertex AI possa importarle.
Configura l'accesso privato ai servizi per il VPC
Quando configuri l'accesso privato ai servizi, stabilisci una connessione privata tra la tua rete e una rete di proprietà di Google o di un servizio di terze parti (producer di servizi). In questo caso, Vertex AI è un producer di servizi. Per configurare l'accesso privato ai servizi, devi riservare un intervallo IP per i producer di servizi, quindi creare una connessione in peering con Vertex AI.
Se hai già un VPC con l'accesso privato ai servizi configurato, passa all'esportazione delle route personalizzate.
- Imposta le variabili di ambiente per l'ID progetto, il nome dell'intervallo riservato e il nome della rete. Se utilizzi il VPC condiviso, utilizza l'ID progetto del progetto host del VPC. In caso contrario, utilizza l'ID progetto del Google Cloud progetto che utilizzi per Vertex AI.
- Abilita le API richieste. Se utilizzi il VPC condiviso, consulta Utilizzare il VPC condiviso con Vertex AI.
- Imposta un intervallo riservato utilizzando
gcloud compute addresses create. Stabilisci una connessione in peering tra il progetto host del VPC e Service Networking di Google utilizzando
gcloud services vpc-peerings connect.Per gli endpoint privati di inferenza, ti consigliamo di riservare almeno un blocco
/21per la subnet per l'hosting dei modelli. La prenotazione di un blocco più piccolo può causare errori di deployment a causa di indirizzi IP insufficienti.La subnet
172.16.0.0/16è riservata per Vertex AI Training. Devi specificare una subnet che non si sovrapponga a questo intervallo CIDR.PROJECT_ID=YOUR_PROJECT_ID gcloud config set project $PROJECT_ID # This is for display only; you can name the range anything. PEERING_RANGE_NAME=google-reserved-range NETWORK=YOUR_NETWORK_NAME # NOTE: `prefix-length=16` means a CIDR block with mask /16 will be # reserved for use by Google services, such as Vertex AI. gcloud compute addresses create $PEERING_RANGE_NAME \ --global \ --prefix-length=16 \ --description="peering range for Google service" \ --network=$NETWORK \ --purpose=VPC_PEERING # Create the VPC connection. gcloud services vpc-peerings connect \ --service=servicenetworking.googleapis.com \ --network=$NETWORK \ --ranges=$PEERING_RANGE_NAME \ --project=$PROJECT_ID
Scopri di più sull'accesso privato ai servizi .
Utilizzare il VPC condiviso con Vertex AI
Abilita le API Compute Engine e Service Networking nel progetto host e di servizio. L'API Vertex AI deve essere abilitata per il progetto di servizio.
Crea la connessione in peering di rete VPC tra il tuo VPC e i servizi Google all'interno del progetto host.
Durante la creazione di Vertex AI, devi specificare il nome della rete a cui vuoi che Vertex AI abbia accesso al VPC condiviso.
Verifica che il servizio o l'account utente utilizzato abbia il ruolo Utente di rete Compute (
roles/compute.networkUser).
Riservare intervalli IP per Vertex AI
Quando riserva un intervallo IP per i producer di servizi, l'intervallo può essere utilizzato da Vertex AI e da altri servizi. Se ti connetti a più producer di servizi utilizzando lo stesso intervallo, alloca un intervallo più ampio per ospitarli, in modo da evitare l'esaurimento degli IP.
Consulta la tabella delle raccomandazioni per le subnet per assicurarti che la prenotazione IP per l'accesso privato ai servizi sia sufficientemente ampia per il tuo carico di lavoro.
Se un job viene avviato con il --network parametro, verrà avviato in una rete gestita da Google
di cui è stato eseguito il peering con il tuo VPC:
--network = "projects/${host_project}/global/networks/${network}"
Tutti i job che non devono accedere alle tue reti possono essere avviati senza questa dichiarazione, preservando così le allocazioni IP.
Se non riesci a riservare un intervallo IP sufficientemente ampio, valuta la possibilità di eseguire la migrazione da Vertex AI con accesso privato ai servizi a Vertex AI con Private Service Connect
Esportare route personalizzate
Se utilizzi route personalizzate, devi esportarle in modo che Vertex AI possa importarle. Se non utilizzi route personalizzate, salta questa sezione.
Per esportare le route personalizzate, aggiorna la connessione in peering nel VPC. L'esportazione di route personalizzate invia tutte le route statiche e dinamiche idonee presenti nella rete VPC, ad esempio le route alla rete on-premise, alle reti dei producer di servizi (in questo caso Vertex AI ). In questo modo vengono stabilite le connessioni necessarie e i job di addestramento possono inviare il traffico alla rete on-premise.
Assicurati che la rete on-premise disponga di route di ritorno agli intervalli di indirizzi IP allocati per Vertex AI in modo che le risposte vengano instradate correttamente a Vertex AI. Ad esempio, utilizza gli annunci di route personalizzate del router Cloud che includono gli intervalli di indirizzi IP di Vertex AI.
Scopri di più sulle connessioni private con le reti on-premise.
Console
- Vai alla pagina Peering di rete VPC nella Google Cloud console.
Vai alla pagina Peering di rete VPC - Seleziona la connessione in peering da aggiornare.
- Fai clic su Modifica.
- Seleziona Esporta route personalizzate.
gcloud
Trova il nome della connessione in peering da aggiornare. Se hai più connessioni in peering, ometti il flag
--format.gcloud services vpc-peerings list \ --network=$NETWORK \ --service=servicenetworking.googleapis.com \ --project=$PROJECT_ID \ --format "value(peering)"
Aggiorna la connessione in peering per esportare le route personalizzate.
gcloud compute networks peerings update PEERING-NAME \ --network=$NETWORK \ --export-custom-routes \ --project=$PROJECT_ID
Controllare lo stato delle connessioni in peering
Per verificare che le connessioni in peering siano attive, puoi elencarle utilizzando il seguente comando:
gcloud compute networks peerings list --network $NETWORK
Dovresti vedere che lo stato del peering appena creato è ACTIVE.
Scopri di più sulle connessioni in peering attive.
Risoluzione dei problemi
Questa sezione elenca alcuni problemi comuni per la configurazione del peering di rete VPC con Vertex AI.
Quando configuri Vertex AI per l'utilizzo di una rete VPC condiviso, specifica l'URI di rete nel seguente modo.
"projects/YOUR_SHARED_VPC_HOST_PROJECT/global/networks/YOUR_SHARED_VPC_NETWORK"
Se specifichi una rete VPC condivisa da utilizzare per Vertex AI, assicurati che tutti gli utenti o gli attori del service account per Vertex AI nel progetto di servizio abbiano il ruolo
compute.networkUserconcesso nel progetto host.Assicurati di aver allocato un intervallo IP sufficiente per tutti i producer di servizi a cui si connette la tua rete, incluso Vertex AI.
Se visualizzi i messaggi di errore
IP_SPACE_EXHAUSTED,RANGES_EXHAUSTEDoPEERING_RANGE_EXHAUSTED, devi aumentare la quantità di indirizzi IP disponibili per la prenotazioneservicenetworkingnella tua rete. Puoi aggiungere un nuovo intervallo alla configurazione di peering di rete VPC esistente o eliminare alcune risorse Vertex AI per rilasciare gli indirizzi IP allocati.Timeout di connessione: dopo l'esportazione delle route personalizzate, le connessioni da Vertex AI verranno instradate attraverso la tua rete per raggiungere gli endpoint in altre reti. Tuttavia, questi endpoint potrebbero non essere instradati attraverso la tua rete per inviare le risposte a Vertex AI. Assicurati di aggiungere anche route statiche o dinamiche in queste reti per il percorso di ritorno all'intervallo IP allocato di Vertex AI.
Errori di timeout di connessione / host non raggiungibile: poiché il peering transitivo non è supportato, le connessioni da Vertex AI non potranno raggiungere gli endpoint in altre reti di cui è stato eseguito il peering diretto con la tua rete, anche se l'opzione "Esporta route personalizzate" è abilitata. Collabora con l'amministratore di rete per assicurarti che non vengano effettuati tentativi di instradare direttamente la tua rete da una rete di cui è stato eseguito il peering diretto a un'altra. Se necessario, puoi sostituire uno di questi hop di peering con una soluzione che supporta route statiche o dinamiche.
Errori DNS host non raggiungibile: se il job Vertex AI deve risolvere i nomi host in nel VPC, assicurati di aver completato la configurazione per condividere le zone DNS private con i producer di servizi.
Se il job della pipeline non riesce a essere creato con "errore interno" identificato in Esplora log, assicurati di aver eseguito il deployment di una rete VPC oltre alla subnet di accesso privato ai servizi.
Puoi controllare quali servizi utilizzano quali indirizzi IP in modo che, ad esempio, tu possa vedere quali servizi utilizzano blocchi di indirizzi IP di grandi dimensioni ed evitare l'esaurimento degli indirizzi IP.
Se visualizzi il messaggio di errore
Unable to create an instance within a Shared VPC network, consulta Risoluzione dei problemi di Vertex AI Workbench.Se visualizzi il messaggio di errore
For the peered network $network_name, couldn't find a free blocks in allocated IP ranges. This is needed to create the cluster., devi aumentare la quantità di intervalli allocati disponibili per il servizio. Puoi farlo nei seguenti modi:- Aggiungi un nuovo intervallo allocato alla tua rete e aggiungilo alla tua
servicenetworking-googleapis-comconnessione privata. Tieni presente che la dimensione minima dell'intervallo allocato richiesta è/18. - Elimina le risorse Vertex AI esistenti non utilizzate per rilasciare gli indirizzi IP allocati.
- Utilizza Network Analyzer per identificare l'utilizzo della subnet e i potenziali problemi.
- Aggiungi un nuovo intervallo allocato alla tua rete e aggiungilo alla tua
Per ulteriori informazioni sulla risoluzione dei problemi, consulta la guida alla risoluzione dei problemi relativi al peering di rete VPC .
Passaggi successivi
- Scopri come utilizzare l'IP privato per l'addestramento personalizzato.
- Scopri come utilizzare gli endpoint privati per l'inferenza.
- Scopri di più sul peering di rete VPC.
- Consulta le architetture di riferimento e le best practice per la progettazione di VPC.