Recomendaciones a otros que estén considerando Apache Airflow:
Si deseas una herramienta ETL que requiera algo de programación, esta herramienta podría ser tu primera opción. La codificación en Airflow no está basada en GUI y, por lo tanto, puede no ser adecuada para todos los ingenieros de ETL. Sin embargo, podría satisfacer todas tus necesidades básicas. La capacidad de conectarse a bases de datos heterogéneas y realizar una comparación entre estos conjuntos de datos es una provisión que aún está por llegar. Reseña recopilada por y alojada en G2.com.
¿Qué problemas resuelve Apache Airflow ¿Y cómo te beneficia eso?
Apache Airflow se está utilizando en mi organización para realizar la integración de datos en la región de AWS S3. La herramienta me ha permitido conectarme con éxito a una base de datos relacional, realizar extracciones de datos y compilar la acumulación de extracciones en múltiples segmentos de archivos planos. Los componentes DAG son propicios para construir y la dependencia de tareas dentro de los DAGs es fácil de especificar. La funcionalidad ETL de extremo a extremo se implementó con éxito utilizando Apache Airflow. La herramienta proporciona flexibilidad para activar diferentes DAGs en cualquier momento del día y asegura que los registros se rastreen con éxito. La herramienta se puede configurar con éxito en un entorno AWS o en un contenedor Docker. Se configuró en ambos entornos con éxito dentro de mi organización y esta flexibilidad es lo que la hace la mejor. Reseña recopilada por y alojada en G2.com.