Présentation des sauvegardes

Cette page décrit ce qu'est une sauvegarde, comment elle fonctionne, certains cas d'utilisation fréquents, et présente les bonnes pratiques à suivre pour créer et utiliser des sauvegardes. Pour apprendre à créer et à gérer des sauvegardes, ainsi qu'à restaurer une instance Filestore à partir d'une sauvegarde, consultez Sauvegarder des données pour la reprise après sinistre.

Qu'est-ce qu'une sauvegarde ?

Une sauvegarde Filestore est une copie d'un partage de fichiers qui inclut toutes les données et métadonnées de celui-ci à partir du moment où la sauvegarde est créée.

Après avoir créé une sauvegarde d'un partage de fichiers, vous pouvez modifier ou supprimer le partage de fichiers d'origine sans affecter la sauvegarde.

Vous pouvez utiliser une sauvegarde pour restaurer un partage de fichiers sur une nouvelle instance Filestore ou, pour les instances de niveau de base, sur la source d'un partage de fichiers existant.

Les sauvegardes sont des ressources régionales qui restent dans la région que vous spécifiez au moment de la création. Vous pouvez créer des sauvegardes dans la même région que l'instance Filestore ou dans une autre région pour réduire le risque de perte de données.

Les sauvegardes sont globalement adressables et peuvent servir à restaurer des partages de fichiers vers n'importe quelle région, mais elles ne peuvent pas être partagées entre plusieurs projets.

Tarifs

Les frais de transfert réseau s'appliquent au trafic réseau interrégional. Pour en savoir plus, consultez la page Tarifs.

Créer une sauvegarde

La première sauvegarde que vous créez est une copie complète de toutes les données et métadonnées d'un partage de fichiers. Chaque sauvegarde suivante copie les modifications successives apportées aux données depuis la sauvegarde précédente.

Chaînes de sauvegarde

Un groupe de sauvegardes associées à la même instance, à la même région et à la même CMEK (le cas échéant) est appelé chaîne de sauvegarde.

Une chaîne de sauvegarde réside dans un seul bucket et une seule région Cloud Storage. Elle peut se trouver en dehors de la région utilisée pour stocker l'instance source.

Tous les niveaux de service sont compatibles avec plusieurs chaînes de sauvegarde, ce qui vous permet de stocker les sauvegardes d'une instance dans plusieurs régions.

Chaque fois qu'une sauvegarde est créée, la sauvegarde précédente est analysée pour détecter les modifications différentielles et incrémentielles :

  • Modifications différentielles : incluent les modifications apportées aux fichiers du partage, telles que les modifications, les ajouts ou les suppressions de fichiers.

  • Modifications incrémentielles : incluent les modifications apportées au stockage dans le bucket où se trouvent les données de sauvegarde. Cela peut inclure la déduplication des données précédemment référencées dans la chaîne.

Chaque fois que vous enregistrez une sauvegarde dans la même chaîne de sauvegarde, la sauvegarde précédente est analysée pour détecter les modifications différentielles et incrémentielles. Dans ce cas, une copie complète n'est pas nécessaire.

Toutefois, le stockage des données d'une instance dans plusieurs chaînes de sauvegarde implique que vous enregistrez et stockez les sauvegardes dans des emplacements alternatifs.

Chaque fois que vous créez une sauvegarde dans un emplacement alternatif, une copie complète de la sauvegarde est à nouveau générée. Attendez-vous à une latence plus élevée pour les opérations de sauvegarde create lorsque vous alternez entre les chaînes de sauvegarde.

Les données non modifiées contenues dans les sauvegardes précédentes sont référencées, mais pas copiées, dans des sauvegardes plus récentes. Si une sauvegarde plus ancienne est supprimée, ses données uniques sont copiées sur la dernière sauvegarde la plus récente et toutes les références de données internes sont automatiquement mises à jour.

En interne, l'historique d'une chaîne de sauvegarde est suivi à l'aide d'instantanés, qui consomment de la capacité sur l'instance source.

La création de la sauvegarde est instantanée, mais son délai est proportionnel à la quantité de données copiées avant que la sauvegarde ne soit disponible. Au cours de cette période, la sauvegarde passe par trois états :

État Durée Description
Création Quelques secondes Capturer l'état actuel du partage de fichiers Toute nouvelle modification des données de partage de fichiers peut ou non être incluse dans la sauvegarde. Les écritures stables confirmées par l'instance avant le lancement de la sauvegarde sont incluses.
Finalisation… Selon la taille Importer des données dans la sauvegarde Aucune nouvelle modification apportée aux données de partage de fichiers n'est incluse dans la sauvegarde.
Ready Jusqu'à la suppression de la sauvegarde La sauvegarde est prête à l'emploi.

Une fois créées, les sauvegardes de niveau de base sont automatiquement compressées pour réduire les coûts. Les performances des instances peuvent être réduites lors de la création d'une sauvegarde pour les instances des niveaux de service zonal, régional et Enterprise. La création d'une sauvegarde n'a aucune incidence sur la disponibilité ni les performances des instances de niveau de base.

Traiter les données redondantes

Par défaut, les sauvegardes sont incrémentielles. Cela vous évite ainsi d'être facturé pour des données redondantes et permet également de réduire l'espace de stockage utilisé. Pour garantir la fiabilité de l'historique des modifications sous-jacent, une sauvegarde peut occasionnellement capturer une copie complète de l'instance.

Pour en savoir plus, consultez Comparer les instantanés et les sauvegardes.

Suppression de la sauvegarde

Les sauvegardes sont des ressources au niveau du projet, et non des sous-ressources de l'instance source. Elles nécessitent leur propre espace de stockage. Par conséquent, le cycle de vie d'une sauvegarde n'est pas lié à celui de l'instance source. La suppression de la source n'entraîne pas celle des sauvegardes associées. Si vous souhaitez supprimer une sauvegarde, vous devez effectuer explicitement une opération de suppression sur la sauvegarde, et non sur l'instance.

Veillez à supprimer les sauvegardes indésirables. Si une instance source est supprimée, les sauvegardes restantes continuent de générer des frais.

La suppression d'une sauvegarde est définitive et irréversible. Si la suppression d'une sauvegarde échoue, l'état est marqué comme invalid. Dans ce cas, réessayez l'opération delete.

Cohérence des sauvegardes

Les sauvegardes Filestore ont une sémantique de cohérence NFSv3 et NFSv4.1. Avant le lancement d'une sauvegarde, toute écriture que l'instance Filestore reconnaît comme étant écrite dans un espace de stockage stable ou suivie d'un COMMIT confirmé est incluse dans la sauvegarde. Pour en savoir plus, consultez la section 3.3.7 du document RFC-1813 NFSv3 ou À propos des protocoles de système de fichiers compatibles.

Cas d'utilisation courants

Les sections suivantes décrivent les cas d'utilisation courants des sauvegardes.

Sauvegarder des données pour la reprise après sinistre

Imaginons que vous disposiez d'une instance Filestore dans us-west1-c et que vous souhaitiez protéger vos données contre les sinistres qui affectent cette région. Vous pouvez programmer une tâche qui crée régulièrement des sauvegardes de cette instance vers une région distante, par exemple us- east1. Si un sinistre concerne us-west1-c, vous pouvez créer une instance dans un autre emplacement à partir d'une sauvegarde précédente.

Sauvegarder des données pour vous protéger contre les modifications accidentelles

Si vous souhaitez protéger vos données Filestore contre les modifications inattendues, vous pouvez planifier une tâche qui crée régulièrement des sauvegardes de l'instance. Si vous perdez des données, vous pouvez parcourir la liste des sauvegardes pour identifier celle qui comporte la version du fichier nécessaire. Vous pouvez ensuite créer une instance Filestore à partir de la sauvegarde, l'installer sur le même client que l'instance d'origine, puis copier le fichier.

Avant de copier le fichier, vous pouvez utiliser la commande Linux diff sur les deux points de montage pour vérifier les différences entre les données de l'instance d'origine et celles restaurées à partir de la sauvegarde. Une fois les données récupérées, vous pouvez supprimer l'instance restaurée et créer une sauvegarde pour conserver l'état actuel de vos données pour une utilisation ultérieure.

Vous pouvez également effectuer une restauration sur place où les données de sauvegarde sont directement restaurées dans l'instance Filestore d'origine, en remplaçant toutes les données dessus par celles de la sauvegarde. Nous vous recommandons de créer une sauvegarde des données les plus récentes avant d'effectuer une restauration sur place, car toutes les données non sauvegardées sont perdues.

Créer des clones pour le développement et les tests

Imaginons que vous disposez d'une base de données configurée sur une instance Filestore qui diffuse le trafic de production. Si vous souhaitez exécuter un test avec une base de données comme entrée, vous pouvez créer une instance Filestore à partir d'une sauvegarde de l'instance de production pour le test. Ainsi, l'utilisation du test n'interfère pas avec l'environnement de production.

De même, vous pouvez utiliser des sauvegardes pour une analyse et une enquête hors connexion sans affecter la production.

Migration de données

Une fois que vous avez créé une instance Filestore, vous ne pouvez plus modifier son emplacement ni son niveau de service. Pour migrer vos données vers une autre région, vous pouvez en créer une sauvegarde et utiliser la sauvegarde pour créer une instance Filestore ou la restaurer sur une instance existante.

Limites des fonctionnalités

Les sauvegardes Filestore sont en disponibilité générale (GA) pour tous les niveaux de service.

Les sauvegardes Filestore ne peuvent pas être combinées avec la fonctionnalité de multipartages Filestore.

Les sections suivantes couvrent en détail les autres limites de fonctionnalités liées aux performances, au stockage, à la capacité, au chiffrement et à d'autres sujets.

Performances

  • Pour les instances très utilisées, les performances peuvent être réduites jusqu'à 15 % lors de l'importation d'une sauvegarde. Les performances des instances de niveau de base ne sont pas affectées par les opérations de sauvegarde create.

  • Le stockage des données d'une instance dans plusieurs chaînes de sauvegarde a une incidence sur les performances de sauvegarde. Attendez-vous à une latence plus élevée pour les opérations de sauvegarde create lorsque vous alternez entre les chaînes de sauvegarde.

  • Les opérations sur les instances, telles que restore ou delete, peuvent être retardées jusqu'à la fin d'une opération de sauvegarde create.

  • Dans certains cas, les opérations delete peuvent prendre jusqu'à 24 heures.

Simultanéité des opérations

  • Les opérations de sauvegarde delete associées à la même instance source doivent être effectuées une par une.

  • Les opérations de sauvegarde groupée delete dans une chaîne de sauvegarde ne sont pas prises en charge. Lorsqu'une opération delete est en attente, toute nouvelle opération delete dans la même chaîne de sauvegarde renvoie une erreur RESOURCE_EXHAUSTED. Cela ne dépend pas de la suppression ou non de l'instance source. Si l'instance source a été supprimée, vous recevrez une erreur FAILED_PRECONDITION.

    Filestore est compatible avec les opérations de sauvegarde simultanées delete lorsque les sauvegardes font référence à des instances sources distinctes.

    Par exemple, une instance libellée Source1 possède des données de sauvegarde référencées dans Backup1 et Backup2. Source2 contient des données de sauvegarde référencées dans Backup3 et Backup4. Backup1 et Backup2 ne peuvent pas être supprimés en parallèle, mais Backup2 et Backup3 le peuvent.

  • Les opérations de sauvegarde create et de sauvegarde delete lancées dans la même chaîne de sauvegarde peuvent s'exécuter simultanément. Si vous avez déjà commencé à créer une sauvegarde, vous devez attendre la fin de l'opération pour supprimer la sauvegarde existante la plus récente. En effet, la sauvegarde la plus récente contient les données les plus importantes nécessaires à la réussite de l'opération de sauvegarde create. Si vous essayez de supprimer la sauvegarde la plus récente, l'erreur FAILED_PRECONDITION s'affiche.

    Par exemple,Source1 a une chaîne de sauvegarde composée de Backup1 et Backup2. Lorsque vous lancez une opération create pour Backup3, vous ne pouvez pas supprimer Backup2 tant que l'opération create n'est pas terminée.

  • Pour en savoir plus sur les limites de débit des opérations, consultez Limites de débit des opérations pour les sauvegardes.

Stockage

  • Vous pouvez restaurer une sauvegarde d'une instance de base sur l'instance source du même niveau de service, sur une instance existante ou sur une nouvelle instance. Si vous choisissez une nouvelle instance, vous pouvez choisir entre une instance HDD de base et une instance SSD de base, quel que soit le niveau de l'instance source.

  • Vous ne pouvez pas restaurer des instances zonales, régionales et Enterprise sur une instance source ou existante, mais uniquement sur une nouvelle instance. Le niveau de la nouvelle instance ne doit pas nécessairement correspondre à celui de l'instance source. Par exemple, vous pouvez restaurer la sauvegarde d'une instance régionale sur une instance zonale. La capacité provisionnée de la nouvelle instance doit être égale ou supérieure à celle de l'instance source.

Capacité

  • Les sauvegardes créées pour les instances zonales, régionales et Enterprise peuvent consommer la capacité des instances. Cette capacité varie en fonction de l'étendue des modifications apportées aux données depuis la création de la sauvegarde. Plus précisément, lorsqu'une sauvegarde est créée, Filestore crée un instantané interne du système de fichiers, qui occupe également une partie de la capacité disponible de l'instance.

  • La taille d'un instantané est également relative à l'étendue des modifications apportées aux données du partage depuis la création de la dernière sauvegarde. Cet instantané continue d'exister jusqu'à ce que la sauvegarde suivante soit créée et importée.

  • Toutes les données référencées par la sauvegarde sont conservées dans l'état où elles se trouvaient au moment de la capture et continuent d'occuper de l'espace dans le système de fichiers. Par exemple, si vous supprimez des données du système de fichiers installé, cette action ne libère pas de capacité. Pour ce faire, vous devez créer une sauvegarde après avoir supprimé ou écrasé une quantité importante de données.

    Pour obtenir une description détaillée des modifications différentielles et incrémentielles, et de la façon dont elles sont traitées, consultez Création de sauvegardes.

  • Pour anticiper une capacité suffisante pour vos charges de travail, envisagez d'appliquer l'une des solutions suivantes :

    • Augmentez la capacité des instances pour les charges de travail avec des modifications de données importantes et fréquentes ou un taux de modification élevé.

    • Effectuez des sauvegardes fréquentes. Si la dernière sauvegarde est obsolète, l'instantané interne peut accumuler davantage de modifications et consommer plus de capacité d'instance.

Chiffrement

Lorsque vous utilisez CMEK pour chiffrer vos chaînes de sauvegarde, les limites suivantes s'appliquent :

  • Une chaîne de sauvegarde entière est chiffrée à l'aide de la même clé CMEK.

  • Lorsque vous créez une sauvegarde avec CMEK, la clé CMEK doit se trouver dans la même région que la sauvegarde cible.

  • Si vous stockez une chaîne de sauvegarde dans une région distincte de l'instance source, vous devrez peut-être appliquer des clés distinctes, une pour la source et une pour la chaîne de sauvegarde.

    • Tous les niveaux de service sont compatibles avec plusieurs chaînes de sauvegarde ou avec la possibilité de stocker les sauvegardes d'une instance dans plusieurs régions. Si vous choisissez d'utiliser une clé CMEK pour le chiffrement, elle doit se trouver dans la même région que la ressource qu'elle chiffre. Si vous stockez des sauvegardes dans une région distincte de la source et que la clé CMEK n'est pas une clé multirégionale, vous devez utiliser des clés CMEK distinctes. Pour en savoir plus, consultez Restrictions CMEK et Choisir le meilleur emplacement CMEK.
  • Une seule clé CMEK est appliquée au bucket Cloud Storage dans lequel la chaîne de sauvegarde est stockée. Elle ne peut pas être combinée ni remplacée.

  • La CMEK n'est pas compatible avec les sauvegardes de niveau de base.

Pour en savoir plus, consultez Compatibilité CMEK pour les chaînes de sauvegarde.

Protocoles

  • Lorsque vous restaurez une sauvegarde, la nouvelle instance doit utiliser le même protocole que l'instance source.

Bonnes pratiques

Les sections suivantes présentent les bonnes pratiques recommandées.

Préparer votre partage de fichiers pour une meilleure cohérence des sauvegardes

La qualité d'une sauvegarde dépend de la capacité de votre application à effectuer la récupération à partir de sauvegardes créées lors d'importantes charges de travail d'écriture. Dans la plupart des cas, vous pouvez créer des sauvegardes avec une bonne cohérence même lorsque vos applications écrivent des données dans le partage de fichiers. Toutefois, si vos applications nécessitent une cohérence stricte, nous vous recommandons d'effectuer l'une ou plusieurs des opérations suivantes :

  • Utilisez l'installation de synchronisation. Pour en savoir plus, consultez la section "Option d'installation de synchronisation" dans nfs(5). Vous pouvez également ouvrir des fichiers avec les options O_DIRECT|O_SYNC. Pour en savoir plus, consultez open(2).
  • Mettez en veille les applications ou les processus du système d'exploitation qui écrivent des données dans le partage de fichiers, et forcez leur modification au partage de fichiers avant de lancer la sauvegarde. Pour en savoir plus, consultez fsync(2).
  • Si vos applications nécessitent une cohérence entre plusieurs partages, mettez en pause toutes les applications sur toutes les instances qui écrivent dans tous les partages de fichiers et créez des sauvegardes de tous les partages de fichiers avant de reprendre vos applications.
  • Si vous avez besoin d'une cohérence au niveau de l'application, arrêtez vos applications et désinstallez le partage de fichiers avant de créer une sauvegarde.

Utiliser des sauvegardes existantes comme référence pour réduire les délais de création des sauvegardes

Les sauvegardes existantes d'un partage de fichiers dans une région sont utilisées comme base pour créer de nouvelles sauvegardes du partage de fichiers, ce qui réduit le temps de création des sauvegardes. Par conséquent, nous vous recommandons d'effectuer les opérations suivantes :

  • Effectuez une nouvelle sauvegarde d'un partage de fichiers avant de supprimer la sauvegarde précédente de ce partage de fichiers.

  • Attendez que les nouvelles sauvegardes soient à l'état Ready avant de créer des sauvegardes suivantes du même partage de fichiers.

Planifier des sauvegardes pendant les heures creuses pour réduire le délai de création des sauvegardes

La création de sauvegardes pendant les heures creuses permet de réduire le temps nécessaire à la création d'une sauvegarde. Si vous planifiez des sauvegardes régulières de vos partages de fichiers, nous vous recommandons de les planifier pendant les heures creuses, lorsque cela est possible.

Les heures pleines pour la création de sauvegardes sont la fin de chaque jour ouvré et minuit dans la région où se trouve l'instance Filestore. Nous vous recommandons de créer vos sauvegardes le matin ou en début de journée.

Organiser vos données sur des instances Filestore distinctes pour optimiser l'efficacité

Plus le partage de fichiers est important, plus la sauvegarde est grande, et plus le coût est élevé. Pour ne sauvegarder que les données à sauvegarder, nous vous recommandons d'organiser vos données sur des partages de fichiers distincts, à savoir :

  • Stocker des données critiques avec différents modèles d'écriture ou différentes exigences de sauvegarde sur différents partages de fichiers
  • Limiter le nombre de sauvegardes à créer en conservant des données similaires dans un partage de fichiers.

Quota

Il existe une limite de quota concernant le nombre de sauvegardes par région pour les niveaux de service SSD de base et HDD de base.

Les limites de quota de sauvegarde ne s'appliquent pas aux niveaux de service "Zonal", "Régional" et "Entreprise".

Pour en savoir plus, consultez Niveaux de service et quota.

Premiers pas avec les sauvegardes Filestore

Pour commencer à utiliser cette fonctionnalité, consultez Sauvegarder des données pour la reprise après sinistre.

Étapes suivantes