Ce document liste les quotas et les limites système qui s'appliquent à Document AI.
- Les quotas ont des valeurs par défaut, mais vous pouvez généralement demander des ajustements.
- Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées.
Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité d'une ressourceGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, ils peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Ils protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .
Le système Cloud Quotas permet d'effectuer les opérations suivantes :
- Surveiller votre consommation de produits et services Google Cloud
- Limiter votre consommation de ces ressources
- Demander des modifications de la valeur du quota et automatiser les ajustements de quota
Dans la plupart des cas, lorsque vous tentez d'utiliser une ressource plus que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.
Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.
Ce document répertorie les quotas qui s'appliquent à Document AI.
Niveaux de service
Document AI propose deux niveaux de service et les quotas associés pour les requêtes de traitement en ligne envoyées aux versions de processeur basées sur l'IA générative : les niveaux "provisionné" et "au mieux".
Le quota de niveau provisionné fournit 120 pages par minute pour les versions de processeur de base, telles que les extracteurs personnalisés v1.4 et v1.5, et 30 pages par minute pour les versions de processeur de base, telles que l'extracteur personnalisé v1.5 Pro.
Le quota du niveau "Au mieux" est de 120 pour les versions de processeur de base telles que les extracteurs personnalisés v1.4 et v1.5, et de 60 pour les versions de processeur Pro telles que l'extracteur personnalisé v1.5 Pro. Il n'est utilisé qu'une fois le quota provisionné épuisé. Cela s'applique aux quotas BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS
(métrique best_effort_online_process_document_pages_us
) et à BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU
(métrique best_effort_online_process_document_pages_eu
) dans la console.
Remarques | Extracteur personnalisé v1.4 (basé sur Gemini 2.0 Flash) | Extracteur personnalisé v1.5 (basé sur Gemini 2.5 Flash) | Extracteur personnalisé v1.5 Pro (basé sur Gemini 2.5 Pro) |
---|---|---|---|
Provisionné | 120 | 120 | 30 |
Optimisation limitée | 120 | 120 | 60 |
Provisionné au niveau de l'organisation | 240 | 240 | 60 |
Si vous avez besoin d'un quota supérieur à celui indiqué pour les quotas "au mieux", vous pouvez envoyer une demande d'augmentation de quota en contactant votre représentant de l'équipe commerciale.
Pour sécuriser davantage de capacité disponible en cas de trafic élevé, consultez la section sur la façon de demander une réservation de capacité.
Aucun contrat de niveau de service n'est disponible pour le niveau "Au mieux".
Liste des quotas
Les quotas suivants s'appliquent à Document AI. Ces quotas s'appliquent à tous les projets de la console Google Cloud . Ils sont partagés entre toutes les applications et adresses IP associées à chacun des projets.
Si vous souhaitez traiter plus de requêtes, envoyez une demande de quota Document AI pour votre projet dans la consoleGoogle Cloud .
Dans votre demande, fournissez des informations sur vos besoins et votre cas d'utilisation spécifiques.
Quota de requêtes | Valeur par défaut | Remarques |
---|---|---|
Requêtes par minute | 1 800 par utilisateur | Afficher le quota dans la console Google Cloud |
Requêtes de traitement en ligne par minute (v1bêta2 uniquement) | 600 par projet | Afficher le quota dans la console Google Cloud |
Requêtes de traitement en ligne par minute (États-Unis) | 120 par projet et par type de processeur | Afficher le quota dans la console Google Cloud |
Requêtes de traitement en ligne par minute (UE) | 120 par projet et par type de processeur | Afficher le quota dans la console Google Cloud |
Nombre de pages de traitement de documents en ligne (États-Unis) par minute, par type de processeur et par version de modèle (extracteur personnalisé v1.4 avec Gemini 2.0 Flash uniquement) | 120 pages par minute* | Afficher le quota dans la console Google Cloud |
Nombre de pages de traitement de documents en ligne (UE) par minute, par type de processeur et par version de modèle (extracteur personnalisé v1.4 avec Gemini 2.0 Flash uniquement) | 120 pages par minute* | Afficher le quota dans la console Google Cloud |
Nombre de pages de documents traités en ligne (États-Unis) par minute, par type de processeur et par version de modèle (extracteur personnalisé v1.5 avec Gemini 2.5 Flash uniquement) | 120 pages par minute* | Afficher le quota dans la console Google Cloud |
Nombre de pages de traitement de documents en ligne (UE) par minute, par type de processeur et par version de modèle (extracteur personnalisé v1.5 avec Gemini 2.5 Flash uniquement) | 120 pages par minute* | Afficher le quota dans la console Google Cloud |
Requêtes de traitement en ligne par minute (une seule région) | 6 par projet et par type de processeur | Afficher le quota dans la console Google Cloud |
Requêtes simultanées de traitement par lot par projet et par région (États-Unis) | 5 par projet | Afficher le quota dans la console Google Cloud |
Requêtes de traitement par lot simultanées par projet et par région (UE) | 5 par projet | Afficher le quota dans la console Google Cloud |
Requêtes de traitement par lot simultanées par processeur (région unique) | 5 par projet | Afficher le quota dans la console Google Cloud |
Nombre de pages pendant un traitement actif (v1beta2 uniquement) | 10 000 par projet | Afficher le quota dans la console Google Cloud |
Requêtes simultanées d'entraînement de versions de processeur (États-Unis) | 1 par projet | Afficher le quota dans la console Google Cloud |
Requêtes simultanées d'entraînement de versions de processeur (UE) | 1 par projet | Afficher le quota dans la console Google Cloud |
Requêtes simultanées pour l'entraînement de versions de processeur (une seule région) | 1 par projet† | Afficher le quota dans la console Google Cloud |
Versions déployées de processeurs personnalisés (États-Unis) | 5 par projet | Afficher le quota dans la console Google Cloud |
Versions déployées de processeurs personnalisés (UE) | 5 par projet | Afficher le quota dans la console Google Cloud |
Versions déployées de processeurs personnalisés (une seule région) | 5 par projet | Afficher le quota dans la console Google Cloud |
Versions déployées du processeur génératif (États-Unis) | 100 par projet et par processeur d'extraction personnalisé | Afficher le quota dans la console Google Cloud |
Versions déployées du processeur génératif (UE) | 100 par projet et par processeur d'extraction personnalisé | Afficher le quota dans la console Google Cloud |
Versions de processeur génératif déployées (région unique) | 100 par projet et par processeur d'extraction personnalisé | Afficher le quota dans la console Google Cloud |
Requêtes simultanées d'importation de documents (États-Unis) | 3 par projet | Afficher le quota dans la console Google Cloud |
Requêtes d'importation de documents simultanées (UE) | 3 par projet | Afficher le quota dans la console Google Cloud |
Requêtes d'importation de documents simultanées (une seule région) | 3 par projet | Afficher le quota dans la console Google Cloud |
Requêtes simultanées d'exportation de documents (États-Unis) | 1 par projet | Afficher le quota dans la console Google Cloud |
Requêtes d'exportation de documents simultanées (UE) | 1 par projet | Afficher le quota dans la console Google Cloud |
Requêtes d'exportation de documents simultanées (une seule région) | 1 par projet | Afficher le quota dans la console Google Cloud |
* Les demandes d'ajustement de quota ne sont pas encore acceptées pour cette version.
† Compatible avec australia-southeast1
sur demande d'ajustement de quota.
Envoyer une demande de réservation de capacité
La réservation de capacité Document AI fournit une capacité réservée pour diffuser du trafic de prédiction en temps réel et à volume élevé pendant la période souscrite, ce qui permet de répondre aux exigences du contrat de niveau de service (SLA). Chaque unité correspond à une page par minute supplémentaire au-delà du quota par défaut.
La réservation de capacité est acceptée et requise pour augmenter les quotas de niveau provisionné des modèles extracteur personnalisé v1.4 et v1.5, y compris les versions de processeur affinées basées sur ces modèles.
La réservation de capacité coûte 300 $par page supplémentaire par minute et par mois.
Pour envoyer une demande de réservation de capacité :
Console
Dans la console Google Cloud , accédez à la page IAM et administration > Réservation de capacité :
Cliquez sur le bouton Créer une réservation de capacité près de l'en-tête de la page. Vous serez redirigé vers un formulaire de demande de deux pages.
Remplissez la page Configurer avec les informations suivantes :
- Saisissez un nom pour la commande.
- Sélectionnez une région.
- Sélectionnez la version du processeur dans le menu déroulant.
- Indiquez le nombre de pages supplémentaires par minute dont vous avez besoin par mois.
- Sélectionnez la durée de l'abonnement mensuel.
- Sélectionnez la date et l'heure de début.
- Sélectionnez une option de renouvellement automatique dans le menu déroulant.
Cliquez sur Continuer.
La deuxième page affiche une estimation du coût mensuel. Vous devez saisir CONFIRMER pour valider l'achat.
Cliquez sur Confirmer et envoyer pour confirmer votre commande.
Vous pourrez consulter l'état de la demande dans l'onglet Réservation de capacité.
Voici les trois états possibles :
- Inactif : l'abonnement n'a pas encore commencé.
- Actif : l'abonnement est en cours.
- Terminée : l'abonnement est terminé.
Éléments à prendre en compte avant d'acheter une réservation de capacité
Pour vous aider à décider si vous souhaitez acheter une réservation de capacité, tenez compte des points suivants :
Vous ne pouvez pas annuler votre commande en cours de période.
Votre achat de réservation de capacité est un engagement, ce qui signifie que vous ne pouvez pas annuler la commande en cours de période. Toutefois, vous pouvez augmenter le nombre de GSU achetés. Si vous souscrivez un engagement par accident ou si votre configuration pose problème, contactez votre responsable de compte Google Cloud pour obtenir de l'aide.
Vous pouvez renouveler automatiquement votre abonnement.
Lorsque vous envoyez votre commande, vous pouvez choisir de renouveler automatiquement votre abonnement une fois arrivé à échéance ou de le laisser expirer. Vous pouvez annuler le processus de renouvellement automatique. Pour annuler votre abonnement avant son renouvellement automatique, annulez le renouvellement automatique 30 jours avant le début de la période suivante.
Vous pouvez configurer le renouvellement automatique des abonnements mensuels chaque mois. Les conditions hebdomadaires ne sont pas compatibles avec le renouvellement automatique.