Ingeniero de Datos Senior/Principal

  • Full Time
Job expired!

Resumen del Puesto

El Ingeniero de Datos Principal/Primer Ingeniero de Datos jugará un rol crucial en la construcción, mantenimiento y mejora de los procesos ETL que impulsan nuestras plataformas de análisis y aprendizaje automático. Esta persona será responsable de desarrollar insights accionables a partir de conjuntos de datos complejos, y trabajará estrechamente con varias unidades de negocio para informar estrategias y toma de decisiones.

Serás la primera contratación en esta función.

Ubicación

  • Área de la Bahía de SF, NYC, o Remoto

Responsabilidades Clave

  1. Desarrollo de ETL & Backend:

  • Diseñar y optimizar tuberías ETL.

  • Desarrollar robustos sistemas de backend para el procesamiento de datos a gran escala utilizando Elixir y soluciones de base de datos como Cassandra/ScyllaDB.

  1. Arquitectura de Datos:

  • Diseñar modelos de datos escalables y eficientes para Cassandra y ScyllaDB.

  • Asegurar la integridad, calidad y seguridad de los datos.

  1. Apoyo a la Ciencia de Datos:

  • Colaborar con científicos de datos, proporcionándoles conjuntos de datos limpios y confiables.

  • Ayudar en la implementación y escalado de modelos de ciencia de datos.

  1. Innovación e Investigación:

  • Mantenerse al corriente de las últimas tecnologías.

  • Recomendar mejoras técnicas para el procesamiento y almacenamiento de datos.

Requisitos

Necesarios

  • Título de Licenciatura o Maestría en Ciencias de la Computación, Ingeniería, o un campo técnico relacionado.

  • Más de 5 años de experiencia en desarrollo de backend, con un fuerte enfoque en ingeniería de datos.

    • Habilidades técnicas: Experticia en Python, Java, Scala, y Elixer para los procesos de backend y ETL.

    • Dominio de herramientas/marcos de trabajo ETL (por ejemplo: Apache Kafka, Apache Airflow).

    • Conocimiento profundo de bases de datos SQL/NoSQL, incluyendo Cassandra y ScyllaDB, y soluciones de almacenamiento de datos (p.ej., Redshift, BigQueary, Snowflake).

    • Competencia en plataformas en la nube (AWS, GCP, Azure) y sistemas distribuidos.

    • Familiaridad con conceptos, herramientas y librerías de ciencia de datos (p.ej., Pandas, Scikit-learn).

    • Habilidades blandas: Habilidades de resolución de problemas excepcionales.

    • Comunicación fuerte para discusiones técnicas y no técnicas.

Deseables

  • Experiencia con plataformas en la nube como AWS, GCP, o Azure.

  • Habilidades excepcionales de comunicación, tanto verbal como escrita.

  • Experticia en algoritmos y marcos de trabajo de aprendizaje automático (p.ej., TensorFlow, PyTorch, scikit-learn).

Beneficios

  • Sueldo competitivo ($150,000-$225,000/año) y opciones de acciones

  • Planes de salud, dental y visión completos

  • 401(k)

  • Horas de trabajo flexibles y opciones de trabajo a distancia

  • Eventos regulares y actividades de team building