Machine Learning Engineer

Job expired!

Chez Ripjar, nous donnons aux gouvernements et aux organisations les moyens d'automatiser la détection, l'enquête et la surveillance des menaces liées aux activités criminelles. Initialement issu de GCHQ, notre équipe dynamique de 140 professionnels est basée à Cheltenham, Bristol, Londres, Canberra et dispose d'une présence croissante aux États-Unis et à Singapour.

Nous offrons deux produits réussis et interconnectés : Labyrinth Screening et Labyrinth Intelligence. Labyrinth Screening aide les entreprises à surveiller leurs clients ou fournisseurs pour détecter des entités non autorisées ou éthiquement discutables. Labyrinth Intelligence permet aux organisations de mener des enquêtes approfondies sur des ensembles de données variés pour découvrir des motifs et des relations intéressants.

Les données sont au cœur de Ripjar. Nous gérons des ensembles de données diversifiés, y compris une archive en constante expansion de 10 milliards d'articles de presse dans presque toutes les langues, 30 ans de données de sanctions et de listes de surveillance des gouvernements, et 250 millions d'entités de registres d'entreprises mondiales.

C'est un moment exceptionnel pour faire partie d'une équipe talentueuse de technologues et de scientifiques des données dédiés à la création de produits innovants qui redéfinissent la manière dont les activités criminelles sont détectées et prévenues.

L'équipe d'analytique centrale, qui fait partie du département d'ingénierie, est essentielle pour fournir des produits et des logiciels de science des données de haute qualité. Nous combinons compétences techniques, mises en œuvre de processus et gestion logicielle, le tout porté par une culture d'innovation continue.

Nous recherchons un Ingénieur en apprentissage automatique expérimenté et très motivé pour concevoir, développer et maintenir les produits analytiques et de données de Ripjar. Votre rôle impliquera :

  • Conception et mise en œuvre de solutions d'apprentissage automatique
  • Développement et optimisation de modèles d'apprentissage automatique
  • Intégration aux produits logiciels et pipelines de données de Ripjar
  • Amélioration des performances et de l'évolutivité du système
  • Utilisation de divers modèles de langue (y compris des LLM), outils d'apprentissage automatique, et grappes distribuées à grande échelle

Vous aurez besoin d'une solide formation technique et théorique et de compétences en au moins un langage de programmation, notamment Python. Vous devriez être compétent dans la mise en œuvre et l'optimisation d'algorithmes pour gérer des données complexes à grande échelle.

  • Développer des architectures et des cadres pour les systèmes d'apprentissage automatique
  • Améliorer les logiciels et les produits de données de Ripjar avec des modèles avancés de ML
  • Intégrer des modèles de ML dans des composants nouveaux et existants
  • Implémenter des demandes de fonctionnalités pour les composants analytiques de Ripjar
  • Collaborer avec les ingénieurs de données et les équipes d'ingénierie
  • Produire des tests statistiques et des résumés
  • Documenter les conceptions systèmes, modèles et méthodologies de test
  • Soutenir les parties prenantes dans la compréhension des analyses, des modèles et des résultats de test
  • Utiliser l'infrastructure de données de Ripjar pour analyser des ensembles de données et produire des sorties statistiques

Nous valorisons les expériences et perspectives diverses. Si vous pensez pouvoir contribuer, nous voulons avoir de vos nouvelles. Les compétences clés requises incluent :

  • Solide compréhension de l'apprentissage automatique et expérience en déploiement de modèles évolutifs
  • Maîtrise des techniques de ML, y compris le traitement du langage naturel et les grands modèles de langue
  • Compétence en Python et bibliothèques de ML telles que PyTorch/TensorFlow, scikit-learn, numpy et pandas
  • Excellentes compétences en communication et relations interpersonnelles
  • Expérience avec les systèmes de traitement de données à grande échelle comme Spark et Hadoop
  • Développement logiciel agile, y compris les approches de l'exploitation ML