Épisode

Déployer des services OpenAI à grande échelle à l’aide d’unités de débit d’approvisionnement

par Thomas Maurer, David Huntley

Dans cet épisode d’Azure Essentials Show, Thomas et David expliquent comment les entreprises peuvent implémenter et mettre à l’échelle l’IA générative à l’aide d’Azure OpenAI Service. Ils explorent différentes options de déploiement, se concentrent sur les déploiements standard et provisionnés et fournissent des démonstrations sur l’optimisation de ces déploiements avec les meilleures pratiques Azure. David explique le concept d’unités de débit approvisionnées (PTU) et propose des conseils pratiques pour estimer les besoins en matière de PTU, vérifier le quota et les réservations d’achat afin de garantir des performances fiables et de l’efficacité des coûts.

Chapitres

  • 00:00 - Introduction
  • 01:10 - Paiement à l’utilisation
  • 01:25 - Déploiements provisionnés
  • 01:45 - Explication des ptus
  • 02:19 - Démonstration : calculatrice de capacité
  • 03:35 - Démonstration : Vérification des quotas
  • 04:21 - Démonstration : Créer un déploiement de provisionnement
  • 05:47 - Réservations horaires et réservations
  • 06:30 - Les capacités ne sont pas garanties
  • 07:17 - Démonstration : Achat de réservations
  • 09:55 - Surveillance de l’utilisation
  • 10:27 - Conseil : Créer des déploiements, puis des réservations
  • 10:59 - Ressources

Connexion

Azure
Azure OpenAI Service

Vous voulez donner votre avis ? Soumettez un problème ici.