Data Trainer - Machine Learning & NLP

Job expired!

MindTech, un pionnier dans la fourniture de solutions complètes de sécurité des données et de conformité, est à la recherche d'un Formateur en Données / Data Scientist spécialisé en Machine Learning et NLP expérimenté. Notre candidat idéal s'épanouit dans un environnement de haute technologie, façonnant des ensembles de données de haute qualité pour améliorer les solutions basées sur les données à travers divers domaines d'activité.

Le Formateur en Données / Data Scientist sera essentiel dans la génération et la gestion d'ensembles de données robustes utilisés par les développeurs de logiciels et IA, les équipes QA et les ingénieurs terrain. Ce poste se concentre principalement sur la création et la maintenance d'ensembles de données contenant des informations personnelles identifiables, cruciales pour la formation des modèles IA et facilitant les tests QA. Bien que l'objectif principal ne soit pas de développer de nouveaux modèles, les capacités en modélisation seront considérées comme un ajout précieux.

Nous recherchons un membre senior de l'équipe capable de fonctionner de manière indépendante et d'injecter de la créativité dans nos opérations, améliorant nos offres commerciales et nos solutions de données.

  • Développement de jeux de données représentatifs qui imitent les données des clients pour les modules de formation, aidant les équipes QA et de développement.
  • Extraction d'éléments de données sensibles adaptés aux exigences spécifiques du produit et du client.
  • Expérience avérée dans le développement de pipelines ETL complexes, en particulier ceux traitant du texte et des motifs en langage naturel.
  • Expertise en Python et outils tels que pandas, numpy, Gensim, spaCy, NLTK ; compétence avec les bases de données SQL et NoSQL.
  • Diligence démontrée en matière de qualité des données et une compréhension profonde des besoins commerciaux variables.
  • Compétences dans l'écriture de code modulaire et la participation à des environnements collaboratifs incluant les révisions de code.
  • Expérience de liaison avec les développeurs de logiciels, chefs de produit et autres parties prenantes pour intégrer les solutions de données et affiner les exigences commerciales.
  • Compétences fortes en communication avec un talent pour la documentation claire et organisée du logiciel et des données.
  • Expérience avec les pipelines analytiques de texte et les modèles d'apprentissage automatique axés sur la classification de texte et la détection d'entités.
  • Un intérêt ou une expérience en matière de scraping web, de création de contenu automatisée, de cycles de vie ML ou IA, de pipelines CI/CD et de MLOps.
  • Curiosité et empressement à rester informé des dernières tendances de l'industrie en matière d'apprentissage automatique et d'intelligence artificielle.
  • Expérience avec les Grands Modèles de Langage (LLMs) appliqués dans des scénarios commerciaux réels, particulièrement dans la génération de contenu ou de données.
  • La familiarité avec les plateformes de cloud computing telles que Google Cloud et AWS est préférable.

Rejoignez MindTech et profitez d'une atmosphère amicale et professionnelle avec des avantages tels qu'un ordinateur portable ou une station de travail haut de gamme, l'accès à la plateforme de bien-être "Rozumi" pour vous et votre famille, des congés maladie payés, des jours de vacances et des jours fériés nationaux. Nous nous engageons à votre croissance professionnelle et à l'avancement de votre carrière.

Notre produit offre un catalogue maître précis de l'utilisation des données sensibles, permettant aux entreprises de gérer la sécurité des données et la