Entreprise : FactSet
Poste : Ingénieur Logiciel
FactSet recherche activement un Ingénieur Logiciel expérimenté avec une solide expérience en architecture cloud AWS, en déploiement et maintenance d'infrastructure. Ce rôle implique une collaboration avec d'autres ingénieurs pour déployer des applications intégrées avec des modèles de Machine Learning (ML) axés sur le traitement du langage naturel (NLP), la classification et les grands modèles de langage (LLMs).
L'ingénieur logiciel jouera un rôle clé dans le développement d'une feuille de route stratégique pour gérer et étendre les pipelines et l'infrastructure existants soutenant les solutions ML et IA. Les tâches principales incluent :
- Déploiement et maintenance des modèles ML, des bases de données et des applications.
- Soutien à divers projets AI/ML, y compris la modélisation d'entités et de sujets, le balisage/enrichissement sémantique, l'extraction d'informations, et l'intégration de LLMs dans les cadres existants.
- Création de tableaux de bord et de visualisations pour les experts financiers.
- Ingestion et analyse de données structurées et non structurées.
- Développement de processus de collecte de données, d'évaluation de la qualité et de contrôle.
- Se tenir à jour des avancées technologiques et partager ses connaissances et sa passion pour le ML et la technologie avec l'équipe.
- Collaboration avec d'autres équipes d'ingénierie pour une amélioration continue.
Le candidat idéal possédera :
- Un BS ou MS en informatique ou dans un domaine connexe.
- Plus de 5 ans d'expérience en tant qu'ingénieur logiciel.
- Maîtrise de la gestion de l'infrastructure sur AWS et en cloud.
- Expérience en ML et NLP.
- Une solide expérience en écriture et publication de code de qualité destiné à la production en environnement d'entreprise.
- Solides compétences analytiques et esprit d'équipe.
- Maîtrise de l'anglais et capacité à communiquer des sujets complexes à des parties prenantes non techniques.
- Excellente maîtrise de Python.
- Familiarité avec Docker et le développement d'API.
- Expérience avec divers services AWS (p. ex. SageMaker, S3, Athena, Glue, ECS, EC2).
Les compétences supplémentaires avantageuses incluent :
- Expérience avec les RDFs, les magasins triples et l'extraction de relations.
- Gestion de grands volumes de données en environnement de traitement par flux ou par lots.
- Utilisation de MongoDB.
- Connaissance des bibliothèques d'apprentissage profond (Keras, PyTorch, TensorFlow).
- Expérience avec des outils de big data (Pyspark, Hive).
- Expertise en extraction d'informations, en analyse et en segmentation.
- Compréhension des ontologies, de la résolution de taxonomie et de la désambiguïsation.
- Expérience avec des techniques d'apprentissage non supervisé, y compris l'estimation de densité, le clustering et la modélisation de sujets.
- Familiarité avec les bases de données graphiques (AWS Neptune, Neo4j).
- Expérience avec des frameworks de machine learning tels que sklearn et des workflows ML.
- Connaissance des bibliothèques NLP et des outils de prétraitement de texte (nltk, SpaCy).
- Aisance avec les frameworks de grands modèles linguistiques tels que OpenAI et Llama.
- Expérience de travail avec des données non structurées (p. ex. contenu textuel, enregistrements JSON), y compris l'ingénierie des caractéristiques.
- Un historique de travail avec des pratiques de développement Agile en environnement de production.
Si vous êtes passionné