El Centro de Excelencia de Habilitación Digital de IQVIA está contratando a un Ingeniero de Datos Senior para trabajar a distancia desde cualquier parte de Canadá. Nuestra visión está abriendo el camino para un compromiso con el cliente sin precedentes, narración omnicanal de próxima generación, un conjunto de medidas integrado y optimización de campañas en tiempo real, todo impulsado a través de un sistema operativo de datos de extremo a extremo y agnóstico de la plataforma para marketing y análisis inteligentes en el sector de la salud. Al simplificar los flujos de trabajo que solían llevar días en segundos, e integrar funcionalidades que antes requerían varios proveedores en uno, permitimos que las marcas concentren su tiempo y recursos en impulsar resultados reales en el mundo real.
Como Ingeniero de Datos Senior dentro del Centro de Excelencia de Habilitación Digital, jugarás un papel crucial en el diseño, desarrollo y mantenimiento de la infraestructura y los sistemas requeridos para el procesamiento, almacenamiento y análisis de datos eficientes y efectivos para nuestros productos AIM, Email y HCN. Trabajando como parte de un equipo de scrum multifuncional, colaborarás estrechamente con otros ingenieros de software, científicos de datos, probadores de software y propietarios de productos para garantizar el flujo suave de datos en toda la organización, permitiendo la toma de decisiones e ideas basadas en datos. Este papel requiere un fuerte entendimiento de la arquitectura de datos y habilidades de programación en Spark y Scala, junto con una pasión por trabajar con conjuntos de datos grandes y complejos.
Responsabilidades clave:
- Desarrollo de Spark: Diseñar, construir y mantener tuberías de datos escalables y robustas usando Apache Spark.
- Desarrollo de Tuberías de Datos: Diseñar, implementar y optimizar tuberías de datos para extraer, transformar y cargar (ETL) datos desde varias fuentes en sistemas de almacenamiento y procesamiento de datos. Aprovechar las capacidades de procesamiento de datos de Spark para realizar transformaciones y agregaciones complejas en grandes conjuntos de datos.
- Gestión de Almacenamiento de Datos: Desarrollar y gestionar soluciones de almacenamiento de datos utilizando Spark y Scala para garantizar la disponibilidad, integridad y seguridad de los datos. Diseñar e implementar modelos de datos, esquemas e índices para soportar la recuperación y análisis de datos eficientes.
- Integración de Datos: Colaborar con equipos multifuncionales para integrar y consolidar datos de múltiples fuentes, incluyendo bases de datos, API y sistemas externos. Garantizar la integración de datos sin problemas en diferentes plataformas y aplicaciones utilizando los conectores e capacidades de integración de Spark.
- Calidad y Gobernanza de Datos: Implementar controles de calidad de datos y procesos de validación usando Spark y Scala para garantizar precisión, consistencia y fiabilidad de los datos. Establecer y hacer cumplir estándares de gobernanza de datos, protocolos de seguridad de datos y regulaciones de privacidad de datos.
- Optimización del Rendimiento: Identificar y resolver problemas de rendimiento en aplicaciones de Spark, tuberías de datos y bases de datos. Optimizar trabajos de Spark afinando configuraciones, aprovechando mecanismos de caché y aplicando técnicas de optimización.
- Colaboración y Comunicación: Colaborar con equipos multifuncionales, incluyendo científicos de datos y ingenieros de software, para entender sus requerimientos de datos y proveer soluciones de Spark y Scala apropiadas. Comunicar claramente conceptos técnicos complejos y soluciones tanto a partes interesadas técnicas como no técnicas.
- Tecnologías y Tendencias Emergentes: Mantenerse al día con los últimos avances en Spark, Scala, grandes tecnologías de datos, plataformas en la nube y herramientas de gestión de datos. Evaluar y recomendar nuevas tecnologías y enfoques que puedan mejorar las capacidades de ingeniería de datos.
Calificaciones y Habilidades:
- Licenciatura o maestría en Ciencias de la Computación, Sistemas de Información, o un campo relacionado o experiencia equivalente
- Fuertes habilidades de programación en Scala y experiencia con Apache Spark.
- Habilidades en SQL y experiencia trabajando con bases de datos relacionales
- Familiaridad con tecnologías de big data como Hadoop, Kafka o Hive.
- Experiencia con modelado de datos, diseño de esquemas y procesos ETL.
- Comprensión de los conceptos de almacenamiento de datos y experiencia con soluciones de almacenamiento de datos
- Conocimiento de plataformas en la nube como AWS y experiencia con servicios de datos basados en la nube (por ejemplo, S3, EMR, Glue).
- Fuertes habilidades de resolución de problemas y capacidad para analizar y solucionar problemas complejos relacionados con los datos.
- Excelentes habilidades de comunicación y colaboración, con la capacidad de trabajar eficazmente en un entorno de equipo multifuncional.
- Atención al detalle y un fuerte compromiso con la calidad, seguridad y gobernanza de los datos.
#LI-Remote
IQVIA es un proveedor global líder de análisis avanzado, soluciones tecnológicas y servicios de investigación clínica para la industria de las ciencias de la vida. Creemos en empujar los límites de la ciencia humana y la ciencia de datos para hacer el mayor impacto posible, para ayudar a nuestros clientes a crear un mundo más saludable. Conoce más en https://jobs.iqvia.com