Data Engineer II (Python and MongoDB)

Job expired!

Rejoignez Recorded Future en tant qu'Ingénieur des Données II, Pipelines de Données

Avec une équipe impressionnante de 1 000 professionnels de l'intelligence, plus de 300 millions de dollars de ventes et une clientèle mondiale de plus de 1 800 clients, Recorded Future se présente comme la plus grande et la plus avancée des entreprises d'intelligence au monde.

Votre rôle en tant qu'Ingénieur des Données II

Chez Recorded Future, nous collectons des données depuis des plateformes web publiques et des flux de données structurées, incluant des forums publics, des sites de réseaux sociaux et des places de marché numériques. En tant qu'Ingénieur des Données, vous collaborerez avec une équipe dédiée pour construire des pipelines de données robustes qui transforment les données brutes en analyses exploitables pour combattre les menaces de cybersécurité.

Responsabilités clés :

  • Diriger le développement, la production et la maintenance de l'extraction de données à haut volume via des moissonneurs personnalisés, des API et des magasins de données.
  • Créer des pipelines de données de production bien surveillés pour convertir les données brutes en intelligence d'action organisée.
  • Maintenir et améliorer les systèmes de production de flux de données existants.
  • Collaborer avec des ingénieurs juniors et seniors à travers des revues de conception, des revues de code, de la programmation en binôme et des meilleures pratiques du génie logiciel.

Compétences et qualifications :

  • Plus de 2 ans d'expérience en programmation Python et solides compétences en débogage.
  • Maîtrise de structures de données complexes et importantes et transformation de grands ensembles de données en Python.
  • Expérience avec l'interrogation de magasins de données modernes tels que MongoDB et ElasticSearch, et le développement d'APIs correspondants.
  • Capacité à réviser, questionner le code existant et suggérer des modifications.
  • Expérience dans le développement de logiciels de pipeline et la création de programmes ETL durables.
  • Compréhension solide des magasins de données (MongoDB, ElasticSearch, S3, SQL) et de leurs cas d'utilisation.
  • Capable de charger de manière programmée des données structurées à haut volume en utilisant des bibliothèques de science des données Python tout en gérant les contraintes de ressources.
  • Développement de la surveillance de pipeline en Python pour les nouvelles applications et celles déjà existantes.

Pourquoi choisir Recorded Future ?

Les employés de Recorded Future, connus sous le nom de "Futuristes", représentent plus de 40 nationalités et adhèrent à nos valeurs fondamentales de normes élevées, d'inclusion et de conduite éthique. Notre engagement à donner aux clients l'intelligence nécessaire pour perturber les adversaires nous a valu une note de 4,8 étoiles de la part de Gartner et la fidélité de 8 des 10 principales entreprises du Fortune 100.

Pour plus d'informations :

  • Blog & Podcast : Explorez le monde de l'intelligence des menaces cybernétiques.
  • Suivez-nous sur Instagram & Twitter pour les dernières mises à jour.
  • Lisez The Record pour des nouvelles et histoires de cybersécurité.
  • Consultez notre Chronologie pour connaître notre histoire.