Êtes-vous un Data Engineer expérimenté avec une passion pour Python et le Big Data ? Rejoignez Capgemini à Bangalore et faites partie d'une équipe de pointe qui conduit l'innovation et les solutions orientées données. Nous recherchons des personnes avec des compétences avancées et une approche méthodique des tâches.
Compétences Clés Requises
- Compétences avancées en programmation Python avec une solide compréhension de la programmation orientée objet (OOP)
- Familiarité avec les outils Big Data tels qu'Apache Spark, Hadoop, Kafka et Ray
- Expérience en script Python pour interagir avec les bases de données, y compris les bases de l'analyse de données et du traitement d'images
- Expérience pratique avec les bases de données SQL relationnelles
- Maîtrise des frameworks/packages Python tels que Pandas, NumPy, OpenCV, PySpark, SQLAlchemy et Scikit-Learn (SK-Learn)
- Fondation solide en structures de données et algorithmes
- Attention aux détails et approche fortement orientée design pour les tâches
- Compétences en résolution de problèmes avec la capacité de penser différemment
- Compétences en communication efficaces pour la collaboration en équipe interfonctionnelle
- Accent sur l'innovation, orientation données, esprit axé sur les résultats, et adaptation rapide aux nouveaux défis
Qualifications Requises
- Master ou Licence en Informatique, Électronique & Communication, Génie Électrique, ou un domaine connexe, ou MCA
Responsabilités du Poste
- Évaluer le besoin de redessiner ou refactoriser le code pour répondre aux besoins croissants des utilisateurs
- Examiner les données pour identifier les problèmes potentiels du pipeline ETL, notifier les utilisateurs finaux, et proposer des solutions
- Préparer la documentation pour les problèmes du pipeline ETL pour référence future
- Maintenir et mettre à jour les documents de dépannage pour le support de garde
- Améliorer les processus ETL existants avec des pratiques de codage propre pour assurer l'exactitude des données
- Soutenir les tests ETL pour valider les modèles de données et la qualité des nouvelles fonctionnalités
- Résoudre les problèmes ETL avec un minimum de guidance des développeurs ETL
- Développer, gérer, et tester les API REST pour l'intégration des systèmes de flux de travail
- Créer des rapports en utilisant des requêtes SQL et Excel pour mettre en évidence les problèmes de pipeline
- Automatiser les activités de reporting et de nettoyage en utilisant les scripts Python et SQL
Titre du poste : Data Engineer
Expérience : 4 à 6 ans
Localisation : Bangalore
Entreprise : Capgemini
Si vous êtes prêt à atteindre de grands objectifs et à vous adapter rapidement, postulez dès maintenant pour rejoindre l'équipe Capgemini et avoir un impact significatif dans le monde de l'ingénierie des données.