Ubicación: 201 Third Street, San Francisco, California, Estados Unidos
En Capital One, estamos en una misión para crear sistemas de IA fiables, confiables y con intervención humana para revolucionar la banca. Liderando la industria en la aplicación del aprendizaje automático, nos esforzamos por crear experiencias de clientes inteligentes, en tiempo real y automatizadas. Desde notificar a los clientes sobre cargos inusuales hasta proporcionar asistencia en tiempo real, nuestras aplicaciones de IA están simplificando y humanizando la banca.
Gracias a nuestras inversiones en infraestructura de nube pública y plataformas de aprendizaje automático, estamos en una posición única para aprovechar el poder transformador de la IA. Estamos dedicados a construir equipos excepcionales de ciencia aplicada e ingeniería, continuar nuestras capacidades líderes en la industria y entregar infraestructura de IA escalable y de alto rendimiento.
Sobre el Puesto
Estamos buscando un Ingeniero Senior Distinguido en Plataformas de IA con experiencia para ayudarnos a construir la base de nuestras capacidades de IA empresarial. En este rol, desarrollarás servicios de plataforma genéricos para respaldar aplicaciones impulsadas por IA Generativa, crear SDKs y APIs, desarrollar agentes de recuperación de información y modelos como servicio para optimizar LLMs a través de RAG, entre otras tareas. También gestionarás la coordinación de extremo a extremo con operaciones, curarás conjuntos de datos de alta calidad y ayudarás a producir modelos. Tu colaboración con equipos de investigación aplicada y de producto identificará y priorizará servicios en curso y futuros.
Responsabilidades
- Desarrollar servicios de plataforma abstractos para apoyar aplicaciones impulsadas por IA Generativa.
- Crear SDKs y APIs para aplicaciones que incluyen recuperación de información, detección de fraudes, asistentes de IA, recomendaciones y más en nuestras plataformas de IA.
- Diseñar y construir orquestaciones de servicios de RAG, incluyendo ingeniería de prompts, guardrails, bases de datos vectoriales y APIs.
- Construir un servicio de gestión de prompts a través de asociaciones cross-organizacionales.
- Mantenerse actualizado con los últimos avances en operacionalización de aprendizaje automático y tecnologías GenAI.
- Implementar capacidades para apoyar MLOps para modelos fundacionales.
Calificaciones Básicas
- Título de licenciatura en Ciencias de la Computación, Ingeniería de Computadoras, o un campo técnico relacionado.
- Más de 9 años de experiencia en programación con Python, Go, Scala o C/C++.
- Más de 6 años de experiencia diseñando y desplegando aplicaciones empresariales de IA o ML.
- Más de 3 años de experiencia implementando automatización del ciclo de vida completo de ML usando MLOps.
- Más de 4 años liderando equipos desarrollando soluciones de Aprendizaje Automático.
- Más de 1 año de experiencia con sistemas de IA conversacional basados en LLM.
Calificaciones Preferidas
- Maestría o PhD en Ingeniería, Ciencias de la Computación, o un campo técnico relacionado con un enfoque en técnicas modernas de IA.
- Fuertes habilidades de resolución de problemas y análisis, con la capacidad de trabajar de manera independiente y como parte de un equipo.
- Experiencia con Teoría de Grafos o Redes y ML de Grafos, incluyendo frameworks como Deep Graph Learning (DGL) o NetworkX.
- Experiencia diseñando plataformas distribuidas a gran escala en entornos de nube como AWS, Azure o GCP.
- Experiencia construyendo SDKs abstractos y familiaridad con Haystack o Langchain.
- Experiencia arquitectando sistemas en la nube para seguridad, rendimiento, escalabilidad y costo.
- Experiencia entregando grandes modelos a través del ciclo de vida MLOps desde la exploración hasta la entrega.
- Experiencia usando Kubeflow Pipelines para entregar modelos a producción.
- Capacidad para navegar en un entorno con prioridades y plazos en competencia, preferiblemente con experiencia en empresas/startups tecnológicas y orientadas al producto.
- Experiencia en áreas de la pila tecnológica de IA incluyendo ingeniería de prompts, guardrails, bases de datos vectoriales, alojamiento de LLM y ajuste fino.
- Experiencia con la integración vertical