Lieu : Ventes - CA - San Francisco, États-Unis
Chez Capital One, notre ambition est de créer des systèmes d'IA fiables, dignes de confiance et impliquant l'intervention humaine, afin de transformer le secteur bancaire. Notre objectif est de tirer parti de l'IA pour offrir des expériences clients intelligentes et automatisées, apportant simplicité et humanité aux opérations bancaires.
Nous sommes des leaders de l'industrie dans le déploiement de solutions d'IA et d'apprentissage automatique. Nous exploitons nos investissements dans l'infrastructure cloud publique et les plateformes d'apprentissage automatique pour constituer des équipes de science appliquée et d'ingénierie de classe mondiale. Cela nous permet de créer des expériences produits révolutionnaires avec une infrastructure d'IA évolutive et haute performance.
Nous recherchons un Directeur expérimenté des Plates-formes d'IA pour nous aider à développer des capacités d'IA d'entreprise fondamentales. Dans ce rôle, vous vous concentrerez sur la création de services de plate-forme génériques pour prendre en charge les applications alimentées par l'IA générative. Cela inclut le développement de SDK et d'API pour créer des agents, la recherche d'informations et des modèles en tant que service pour optimiser les LLM via RAG.
- Développer des services de plate-forme abstraite pour soutenir les applications d'IA générative.
- Créer des SDK et des API pour des applications telles que la détection de fraude, les assistants IA et les recommandations.
- Concevoir et construire des orchestrations de service de plate-forme RAG, y compris l'ingénierie de prompt et les bases de données vectorielles.
- Construire et gérer un service de gestion de prompt grâce à des partenariats inter-organisationnels.
- Rester à jour avec les dernières avancées dans l'opérationnalisation de l'apprentissage automatique et des technologies GenAI.
- Concevoir et implémenter des capacités MLOps pour des modèles fondamentaux.
- Licence en Informatique, en Ingénierie Informatique ou dans un domaine connexe.
- 8+ années d'expérience en programmation (Python, Go, Scala ou C/C++).
- 5+ années d'expérience en conception, création et déploiement d'applications d'IA/ML d'entreprise.
- 3+ années d'expérience en automatisation ML (MLOps).
- 4+ années d'expérience en gestion d'équipe dans le développement de l'apprentissage automatique.
- 5+ années d'expérience en gestion de personnel.
- 1+ an d'expérience avec des systèmes d'IA conversationnelle basés sur LLM.
- Master ou Doctorat en Ingénierie, en Informatique ou dans un domaine connexe avec une spécialisation en techniques d'IA modernes.
- Solides compétences en résolution de problèmes avec la capacité de travailler de manière indépendante et en équipe.
- Expérience en conception de plates-formes distribuées à grande échelle dans des environnements cloud comme AWS, Azure, ou GCP.
- Expérience en architecture de systèmes cloud pour la sécurité, l'évolutivité et l'efficacité des coûts.
- Expérience en livraison de grands modèles à travers le cycle de vie MLOps, de l'exploration à la mise en service.
- Capacité à travailler dans des environnements rapides avec des priorités et des délais concurrents.
- Expérience dans des entreprises technologiques/produits ou des startups préférée.
- Expérience avec des technologies d'IA telles que l'ingénierie de prompt, les bases de données vectorielles, l'hébergement LLM, le RAG avancé et le fine-tuning.
- Expérience avec des applications LLM et l'intégration verticale avec des applications d'entreprise.
Nous offrons des salaires compétitifs en fonction de l'emplacement :
- New York City (Hybride sur site) : 274 800 $ - 313 600 $
- San Francisco, Californie (Hybride sur site) : 291 100 $ - 332 300 $