Únete a Nuestro Equipo de Ingeniería de Datos de Auditoría
Estamos buscando una persona talentosa y dedicada para unirse a nuestro equipo de Ingeniería de Datos de Auditoría en KPMG India. Este es un rol tecno-funcional en el que desarrollarás experiencia en las herramientas propietarias de KPMG y en las reglas comerciales subyacentes. Tus responsabilidades incluirán extraer, validar, analizar y visualizar datos de los sistemas ERP de nuestros clientes, ya sea alojados en las instalaciones o en la nube. A través de este rol, proporcionarás informes estándar, documentos de trabajo de auditoría y conocimientos a nuestros equipos de Auditoría en múltiples procesos comerciales. Además, asistirás en el desarrollo de soluciones para varios servicios de Datos y Análisis (D&A) de Auditoría.
Desarrollo
- Construir y configurar herramientas ETL para la extracción y transformación exitosa de datos desde múltiples fuentes, ya sea en las instalaciones o en la nube.
- Ser competente en tecnologías de Azure Cloud para realizar la extracción, transformación y carga de datos (ETL). Proporcionar orientación técnica sobre la depuración de errores/problemas en el proceso.
- Diseñar, codificar, verificar, probar, documentar, modificar y refactorizar programas/scripts moderadamente complejos, adhiriéndose a estándares y herramientas acordados para lograr un resultado bien diseñado.
- Desarrollar e implementar procesos de ingestión, transformación y validación de datos utilizando aplicaciones en la nube de Azure, garantizando la calidad, consistencia y fiabilidad de los datos.
- Aplicar técnicas de análisis de datos, diseño, modelado y aseguramiento de la calidad basadas en una comprensión detallada de los procesos comerciales.
- Participar en el diseño, desarrollo e implementación de correcciones y mejoras a módulos nuevos o existentes.
- Asistir o liderar en el desarrollo de rutinas operacionales y/o relacionadas con el equipo de compromiso.
- Liderar entregables del equipo y capacitar a los profesionales para adquirir conocimientos tecnológicos y certificaciones en ingeniería de datos de Azure.
- La experiencia con herramientas de visualización para crear dashboards e informes, o Power Apps, es ventajosa.
El conocimiento del aprovechamiento de algoritmos de IA/ML (k-NN, Naïve Bayes, SVM, Decision Forests) y frameworks de modelado (PyTorch, TensorFlow, Keras) utilizando Python es una ventaja.
Ejecución
- Soportar a los clientes en la extracción de datos de manera remota, manejando complejidades medias a altas y tamaños de datos medianos a grandes.
- Asistir a los equipos de compromiso de Auditoría coordinando con los equipos de TI del Cliente y otros líderes técnicos durante el proceso de extracción de datos.
- Trabajar con los equipos de compromiso para interpretar los resultados y proporcionar conocimientos significativos de auditoría a partir de los informes.
- Desarrollar transformaciones utilizando Azure Databricks, Azure Data Factory, o Python, y manejar cualquier cambio de mapeo de datos y personalizaciones dentro de Databricks utilizando código PySpark.
- Depurar, optimizar, ajustar el rendimiento y resolver problemas con una guía limitada al procesar conjuntos de datos grandes, proponiendo soluciones posibles.
- Conciliar datos a través de múltiples capas de datos para mantener la integridad y completitud de los datos.
- Mantener un estado preciso y actualizado del proyecto para ti y cualquier miembro del equipo asignado.
- Preparar y revisar los documentos necesarios que soportan el compromiso con la máxima atención al detalle.
- Manejar y analizar enormes volúmenes de datos utilizando tecnologías de big data como Azure Databricks y Apache Spark. Crear flujos y pipelines de procesamiento de datos para soportar análisis de datos, aprendizaje automático y otras aplicaciones basadas en datos.
- Capacitar a Asociados en las mejores prácticas de procesamiento de datos y capacitarlos para manejar trabajos de baja complejidad.
Habilidades Técnicas
Habilidades Primarias:
- Azure Data Factory
- Azure Data Lake Storage
- Azure Databricks
- Azure Synapse Analytics