Software Development Engineer III - ETL Engineer

Job expired!

Empresa: Groupon

Groupon es un mercado líder que conecta a las personas con lo mejor que su ciudad o destino tiene para ofrecer. A través del comercio móvil en tiempo real en negocios locales, eventos en vivo y destinos de viaje, Groupon ayuda a las personas a descubrir experiencias que hacen la vida completa, divertida y gratificante. Al apoyar a los negocios locales, fomentamos relaciones fuertes con los clientes y comunidades vibrantes. A pesar de tener miles de empleados en todo el mundo, nuestra cultura inspira innovación, recompensa la toma de riesgos y celebra el éxito.

En Groupon, entendemos que las grandes personas hacen grandes empresas. Combinamos lo mejor de ambos mundos al juntar los recursos y la escala de una gran compañía con la autonomía y el potencial de impacto de una organización más pequeña. Somos curiosos, divertidos, un poco intensos y profundamente comprometidos a ayudar a los negocios locales a prosperar.

El equipo de Ingestión de Datos en Groupon es central para todo lo relacionado con los datos. Definimos y construimos soluciones de siguiente generación basadas en la nube para ingerir y recopilar petabytes de datos en nuestro lago de datos y almacén de datos. Nuestra misión es empoderar a los analistas de datos y científicos de datos en todas las unidades de negocios para tomar decisiones informadas. En este rol, tendrás la oportunidad de combinar tus habilidades en informática, sistemas distribuidos y sistemas de producción escalables y de alto rendimiento.

Diseñar y desarrollar pipelines y marcos de trabajo de ingestión de datos en lote/streaming de alto volumen que abarcan las plataformas de datos de AWS y GCP.
Concebir, codificar y lanzar plataformas de ingestión y recopilación de datos de próxima generación.
Participar en la definición de requisitos, discusiones arquitectónicas de sistemas y datos.
Liderar técnicamente y mentorear a ingenieros junior en desarrollo de software y mejores prácticas de ingeniería de datos.
Colaborar con equipos ágiles multifuncionales, incluidos ingenieros de software, ingenieros de datos, expertos en ML y analistas de datos.

Estamos emocionados de conocerte si tienes:

Licenciatura/Maestría en Ciencias de la Computación con más de 5 años de experiencia en sistemas distribuidos, ingeniería de datos o desarrollo de software.
Fuertes habilidades de codificación en lenguajes como Python y Java.
Experiencia con bases de datos SQL y NoSQL (Teradata, MySQL, Postgres, Cassandra, Elasticsearch, HBase, etc.).
Familiaridad con la línea de comandos de UNIX.
Experiencia en tecnologías de big data como Apache Spark, Hadoop, Hive, etc.
Experiencia profunda con ETL, linaje de datos y problemas de calidad de datos.
Experiencia en pipelines de datos en lote y streaming.
Experiencia con tecnologías en la nube de AWS o GCP, especialmente relacionadas con el procesamiento de datos a escala.
Fuerte comprensión de servicios de producción con SLA estrictos y prácticas de CI/CD.
Excelentes habilidades de comunicación escrita y verbal.
Pasión por construir plataformas de datos y deseo de innovar.

Experiencia con Airflow y Apache Kafka.
Conocimiento de Scala.
Experiencia con HBase y caché Redis.
Experiencia en Google Data Streams y Google Dataproc.
Experiencia con tecnologías de captura de datos en cambio (CDC).
Experiencia con tecnologías modernas de almacén de datos como Delta Lake y marcos Hudi.
Experiencia desarrollando aplicaciones distribuidas con herramientas de registro centralizado, métricas, monitoreo y alertas.

Enfoque en el cliente: Hacer lo correcto para el cliente impulsa nuestro negocio hacia adelante.
Obsesión por la calidad: Tu código simplemente funciona y escala linealmente.
Jugadores de equipo: Trabajas bien con los demás, proporcionando y recibiendo retroalimentación constructiva.
Aprend