Manejo de la ingeniería de características (validación de características, transformación de características, pipeline de características, base de datos de servicio y entrenamiento, metadatos de características y colección de artefactos) y ciclo de vida del modelo ML.
Experiencia práctica en el desarrollo completo de JAVA, Python, experiencia en tensor flow, reactJS y ADO.
Experiencia con la implementación de Datos como servicio.
Se desean conocimientos estadísticos sólidos, habilidades analíticas y de resolución de problemas.
Conocimiento de caché DB , vector DB
Un buen entendimiento de los flujos de trabajo de IA responsable y la gestión de modelos sería muy beneficioso
Experiencia relevante en tecnologías de datos grandes (Hortonworks HDP, Apache Hadoop, HDFS, Hive, Sqoop, Flume, Zookeeper y HBase, Oozie, Spark, Ni-Fi, Kafka, Snap logic, AWS, Red shift).
Experiencia con herramientas de monitoreo.
Capacidades de desarrollo utilizando python, spark, lenguajes R.
Buenas habilidades de gestión y análisis
Buenas habilidades de comunicación escrita y oral
Buena comprensión y experiencia en proyectos (por ejemplo, SDLC, metodología Agile)
Diseñado y implementado ETL pipelines usando Apache Spark, Hive, Snowflake Structured Streaming y Python para procesar datos de flujo de eventos.
Afinación del rendimiento de Apache Spark y Hadoop YARN.
Experiencia con programación en Java
Proporcionar supervisión y orientación al equipo de Hadoop y al equipo de desarrollo
Camunda, Angular
Capacidad para depurar y escribir / modificar scripts en Shell/Python
Muy buen entendimiento del ecosistema de Big Data
El candidato también debe tener buen conocimiento de los patrones de arquitectura de Big Data, patrones de diseño, técnicas de estimación, afinación del rendimiento y resolución de problemas
Dispuesto a trabajar en soporte de guardia durante los fines de semana
Contacto con múltiples equipos de aplicación y coordinar la resolución de problemas
Buenas habilidades analíticas e interacción
Monitoreo continuo y gestión del clúster de Hadoop.