Lieu : 201 Third Street, San Francisco, Californie, États-Unis
Chez Capital One, nous avons pour mission de créer des systèmes d'IA fiables, dignes de confiance et avec une boucle humaine pour révolutionner la banque. En menant l'industrie dans l'application de l'apprentissage automatique, nous nous efforçons de créer des expériences clients intelligentes, en temps réel et automatisées. Depuis la notification des clients concernant des frais inhabituels jusqu'à l'assistance en temps réel, nos applications d'IA simplifient et humanisent la banque.
Grâces à nos investissements dans l'infrastructure cloud publique et les plateformes d'apprentissage automatique, nous sommes exceptionnellement placés pour exploiter le pouvoir transformateur de l'IA. Nous nous consacrons à la construction d'équipes exceptionnelles de sciences appliquées et d'ingénierie, en continuant nos capacités à la pointe de l'industrie et en fournissant une infrastructure d'IA évolutive et performante.
Nous recherchons un Ingénieur Sr. Distingué expérimenté dans les plates-formes d'IA pour nous aider à bâtir la fondation de nos capacités d'IA d'entreprise. Dans ce rôle, vous développerez des services de plate-forme génériques pour soutenir les applications alimentées par l'IA Générative, créerez des SDK et des API, développerez des agents de récupération d'information et des modèles en tant que service pour optimiser les LLM via RAG, entre autres tâches. Vous gérerez également la coordination de bout en bout avec les opérations, sélectionnerez des ensembles de données de haute qualité et aiderez à la mise en production des modèles. Votre collaboration avec les équipes de recherche appliquée et produit permettra d'identifier et de prioriser les services en cours et à venir.
- Développer des services de plate-forme abstraits pour soutenir les applications alimentées par l'IA Générative.
- Créer des SDK et des API pour des applications incluant la récupération d'information, la détection de fraude, les assistants IA, les recommandations et plus encore sur nos plateformes d'IA.
- Concevoir et construire des orchestrations de plate-forme de service RAG, y compris l'ingénierie de prompts, les garde-fous, les bases de données vectorielles et la mise à la terre des API.
- Construire un service de gestion de prompts à travers des partenariats inter-organisationnels.
- Se tenir à jour avec les dernières avancées dans l'opérationnalisation de l'apprentissage automatique et des technologies GenAI.
- Implémenter des capacités pour le support des MLOps pour les modèles de fondation.
- Diplôme de licence en informatique, en ingénierie informatique ou dans un domaine technique connexe.
- Plus de 9 ans d'expérience en programmation avec Python, Go, Scala ou C/C++.
- Plus de 6 ans d'expérience dans la conception et le déploiement d'applications AI ou ML d'entreprise.
- Plus de 3 ans d'expérience dans la mise en œuvre de l'automatisation ML sur tout le cycle de vie à l'aide de MLOps.
- Plus de 4 ans d'expérience dans la direction d'équipes développant des solutions d'apprentissage automatique.
- Plus de 1 an d'expérience avec des systèmes d'IA conversationnelle basés sur LLM.
- Master ou PhD en ingénierie, en informatique ou dans un domaine technique connexe avec un accent sur les techniques d'IA modernes.
- Solides compétences en résolution de problèmes et en analyse, avec la capacité de travailler de manière autonome et en équipe.
- Expérience avec la théorie des graphes ou des réseaux et le Graph ML, y compris des frameworks tels que Deep Graph Learning (DGL) ou NetworkX.
- Expérience dans la conception de plates-formes distribuées à grande échelle dans des environnements cloud tels que AWS, Azure ou GCP.
- Expérience dans la construction de SDK abstraits et familiarité avec Haystack ou Langchain.
- Expérience dans l'architecture de systèmes cloud pour la sécurité, la performance, l'évolutivité et le coût.
- Expérience dans la livraison de grands modèles à travers le cycle de vie MLOps