- Diseñar, desarrollar e implementar canalizaciones de procesamiento de datos utilizando Spark en cuadernos de Databricks.
- Optimizar flujos de trabajo de datos para rendimiento, escalabilidad y fiabilidad.
- Colaborar con científicos de datos y analistas para comprender los requisitos de datos y ofrecer información procesable.
- Asegurar el cumplimiento de las normas de gobernanza y seguridad de datos.
- Incorporar competencias centrales de gestión de datos, incluidas gobernanza de datos, seguridad de datos y calidad de datos.
- Trabajar de manera transversal para entender las oportunidades de datos y construir canalizaciones y diccionarios para fuentes de datos potenciales.
- Asegurar la calidad de los datos mediante la automatización de pruebas y auditorías.
- Experiencia en canalizaciones de CI/CD usando Jenkins.
- Gestionar repositorios de código y control de versiones usando Bitbucket.
- Dominio de Databricks y AWS básico.
- Familiaridad con ciencia de datos, inteligencia empresarial y análisis de datos.
- Conocimiento de integración de datos, almacenamiento de datos, modelado y tácticas y conceptos de presentación.
- Competencia en Power BI, incluidas la visualización de datos y bases de datos relacionales.
- Experiencia con transformación de datos y procesos ETL.
- Sólida comprensión de principios de modelado de datos, como el modelado dimensional y los principios de normalización de datos.
- Dominio en Python y SQL.
- Experiencia con Jenkins para integración continua y entrega continua.
- Familiaridad con Bitbucket para alojamiento de código y colaboración.
Experiencia recomendada: 2+ años de experiencia práctica realizando las tareas de ingeniería de datos enumeradas.
Información adicional:
Nombre de la empresa: Adidas
Título del trabajo: Ingeniero de Datos Databricks de Nivel Intermedio