Descripción de la Empresa
Se busca un Ingeniero de Datos Senior para liderar un pequeño equipo, modernizar una plataforma de datos sencilla y convertirla en un proyecto de análisis de servicio propio basado en la nube.
CLIENTE
Sigma Software proporciona servicios de alta calidad en desarrollo de software, diseño gráfico, pruebas y soporte. Sistemas desarrollados para brindar beneficios al cliente en las industrias automotriz, de telecomunicaciones, aviación, publicidad, juegos, banca, bienes raíces y atención médica.
PROYECTO
Dentro de un proyecto interno en Sigma Software, tenemos dos objetivos principales: automatizar los informes y crear un sistema de análisis de datos de auto-servicio para nuestra empresa.
Serás responsable de diseñar y modelar datos en DWH y Data Marts utilizando Spark y MS SQL, exponiendo estos datos a, y colaborando con, los ingenieros de BI que realizan informes en Apache Superset, y otros roles que consumen dichos datos. Además, trabajarás con varios otros miembros del equipo que dependen de estos datos. Parte de tu tarea implicará la transición de nuestra solución local a un entorno basado en la nube.
Descripción del puesto
- Nuestro objetivo es crear un sistema eficiente para recopilar, procesar, analizar y visualizar grandes cantidades de datos de diversas fuentes
- Sentar las bases y modelar los datos
- Desarrollar una plataforma para construir y mantener tuberías de datos que recojan datos de diferentes fuentes
- Crear un almacén de datos
- Analizar y preparar descripciones de dominio en colaboración con la análisis de negocios
- Crear Data Marts
- Diseñar un modelo de permisos con control flexible sobre el acceso vertical y horizontal a los datos
Calificaciones
- Conocimiento conceptual de los fundamentos de análisis de datos, por ejemplo, modelado dimensional, ETL/ELT, herramientas de informes, gobierno de datos, almacenamiento de datos, datos estructurados y no estructurados
- Fuerte conocimiento y experiencia con SQL y RDBMS, conocimiento seguro de los fundamentos de las bases de datos
- Experiencia en desarrollo de bases de datos y modelado de datos, idealmente con Databricks/Spark
- Experiencia con Python
- Conocimiento práctico de formatos de serialización y sus compromisos (columnar vs. basado en filas)
- Experiencia en la depuración y optimización de trabajos de Spark
- Fuertes habilidades de comunicación escrita y verbal
- Al menos un nivel de inglés intermedio alto
- BS en Ciencias de la Computación o un campo relacionado
- La experiencia con una herramienta de Inteligencia de Negocios es un plus