Ce que j'apprécie le plus, c'est qu'il soit sans serveur : cela permet d'exécuter des requêtes SQL standard directement sur des données dans Amazon S3, sans avoir à provisionner d'infrastructure ni à déplacer les informations via des processus ETL.
En pratique, c'est super utile pour faire des analyses exploratoires rapides et ad hoc sur des fichiers Parquet ou JSON dans notre Data Lake. De plus, en s'intégrant de manière native avec le catalogue de données AWS Glue, la gestion des métadonnées devient presque transparente et beaucoup plus simple. Avis collecté par et hébergé sur G2.com.
Ce que j'aime le moins, c'est que la facturation par To scanné peut devenir assez imprévisible si les requêtes ne sont pas bien optimisées (par exemple, lorsqu'il n'y a pas de partitions ou que la compression n'est pas utilisée). Un simple *"SELECT" sur un grand ensemble de données peut s'avérer étonnamment coûteux.
De plus, les performances chutent beaucoup avec le problème typique de nombreux petits fichiers sur S3 (problème de petits fichiers), et cela nous oblige finalement à ajouter des processus supplémentaires de compactage avec AWS Glue pour maintenir l'efficacité.
Et enfin, ce n'est pas la meilleure option pour les rapports à faible latence ou avec une haute concurrence : dans ces scénarios, Redshift continue de mieux performer. Avis collecté par et hébergé sur G2.com.
L'évaluateur a téléchargé une capture d'écran ou a soumis l'évaluation dans l'application pour les vérifier en tant qu'utilisateur actuel.
Validé par Google One Tap avec un compte email professionnel
Avis organique. Cet avis a été rédigé entièrement sans invitation ni incitation de la part de G2, d'un vendeur ou d'un affilié.
Cet avis a été traduit de Spanish; Castilian à l'aide de l'IA.

