Ingeniero de Datos Senior de AWS

  • Full Time
Job expired!

Descripción de la Empresa

Vitol es líder en el sector energético con presencia en todo el espectro: desde el petróleo hasta la energía, las energías renovables y el carbono. Desde nuestras 40 oficinas alrededor del mundo, buscamos agregar valor en toda la cadena de suministro de energía, incluyendo la implementación de nuestra escala y entendimiento del mercado para ayudar a facilitar la transición energética. Hasta la fecha, hemos comprometido más de $2 mil millones de capital a proyectos renovables, e identificado y desarrollado oportunidades de bajo carbono en todo el mundo.

Nuestra gente es nuestro negocio. El talento es precioso para nosotros y creamos un ambiente en el cual los individuos pueden alcanzar su máximo potencial, sin limitarse por la jerarquía. Nuestro equipo está compuesto por más de 65 nacionalidades y estamos comprometidos a desarrollar y mantener una fuerza laboral diversa. Conoce más sobre nosotros aquí.

Descripción del Puesto

Como Ingeniero Sénior de Datos, serás responsable de diseñar, implementar y mantener sistemas de procesamiento de datos a gran escala en AWS, asegurando que sean escalables, confiables y eficientes.

Serás altamente técnico, con amplia experiencia trabajando en plataformas MPP/Spark, "big data" (por ejemplo, pronósticos del tiempo, ubicación de barcos, imágenes de satélite, ...), y desarrollando pipelines de datos resilientes y confiables. Serás responsable de los pipelines de datos de principio a fin: adquisición, carga, transformación, implementación de reglas/análisis de negocios, y entrega al usuario final (negocio / ciencia de datos / IA).

También colaborarás directamente tanto con el equipo de Negocios como con otros equipos de entrega y el equipo de Ciencia de Datos para entender sus requerimientos de datos y entregar la infraestructura de datos necesaria para respaldar sus actividades, así como optimizar el rendimiento de los sistemas de procesamiento de datos mediante la afinación de consultas de bases de datos, mejorando los tiempos de acceso a datos y reduciendo la latencia.

Este rol requerirá fuertes habilidades de programación en SQL y Python, y seguir las mejores prácticas de ingeniería.

Debes ser un buen comunicador, y fácilmente traducir conceptos técnicos a usuarios no técnicos, así como traducir los requisitos del negocio en requisitos técnicos.

Calificaciones

  • 10+ años en el área de ingeniería de datos
  • Proficiente con bases de datos MPP (Snowflake, Redshift, Big Query, Azure DW) y/o Apache Spark
  • Proficiente en la construcción de pipelines de datos resilientes para grandes conjuntos de datos
  • Profundo entendimiento de AWS o cloud en servicios básicos y extendidos.
  • 8+ años de experiencia trabajando con al menos 3 de los siguientes: ECS, EKS, Lambda, DynamoDB, Kinesis, AWS Batch, ElasticSearch/OpenSearch, EMR, Athena, Docker/Kubernetes
  • Proficiente con Python y SQL, y con buena experiencia en modelado de datos
  • Experiencia con herramientas modernas de orquestación (Airflow / Dagster / Prefect / similar) y/o DBT
  • Cómodo trabajando en un ambiente dinámico con cierto grado de incertidumbre

Información Adicional

Deseado:

  • Infraestructura como código (Terraform, Cloud Formation, Ansible, Serverless)
  • Pipelines CI/CD (Jenkins / BitBucket Pipelines / similar)
  • Habilidades de ajuste de bases de datos/SQL
  • Conceptos básicos de ciencia de datos