Spanish
- English
- French
- Ukrainian
- Polish
- Russian

Sr. Distinguished Engineer, Generative AI, Platform Agents and Tooling (Remote Eligible)

Other
San Francisco
06/23/2024
-

Job expired!

Ubicación: 201 Third Street, San Francisco, California, Estados Unidos

En Capital One, estamos en una misión para crear sistemas de IA fiables, confiables y con intervención humana para revolucionar la banca. Liderando la industria en la aplicación del aprendizaje automático, nos esforzamos por crear experiencias de clientes inteligentes, en tiempo real y automatizadas. Desde notificar a los clientes sobre cargos inusuales hasta proporcionar asistencia en tiempo real, nuestras aplicaciones de IA están simplificando y humanizando la banca.

Gracias a nuestras inversiones en infraestructura de nube pública y plataformas de aprendizaje automático, estamos en una posición única para aprovechar el poder transformador de la IA. Estamos dedicados a construir equipos excepcionales de ciencia aplicada e ingeniería, continuar nuestras capacidades líderes en la industria y entregar infraestructura de IA escalable y de alto rendimiento.

Sobre el Puesto

Estamos buscando un Ingeniero Senior Distinguido en Plataformas de IA con experiencia para ayudarnos a construir la base de nuestras capacidades de IA empresarial. En este rol, desarrollarás servicios de plataforma genéricos para respaldar aplicaciones impulsadas por IA Generativa, crear SDKs y APIs, desarrollar agentes de recuperación de información y modelos como servicio para optimizar LLMs a través de RAG, entre otras tareas. También gestionarás la coordinación de extremo a extremo con operaciones, curarás conjuntos de datos de alta calidad y ayudarás a producir modelos. Tu colaboración con equipos de investigación aplicada y de producto identificará y priorizará servicios en curso y futuros.

Responsabilidades

Desarrollar servicios de plataforma abstractos para apoyar aplicaciones impulsadas por IA Generativa.
Crear SDKs y APIs para aplicaciones que incluyen recuperación de información, detección de fraudes, asistentes de IA, recomendaciones y más en nuestras plataformas de IA.
Diseñar y construir orquestaciones de servicios de RAG, incluyendo ingeniería de prompts, guardrails, bases de datos vectoriales y APIs.
Construir un servicio de gestión de prompts a través de asociaciones cross-organizacionales.
Mantenerse actualizado con los últimos avances en operacionalización de aprendizaje automático y tecnologías GenAI.
Implementar capacidades para apoyar MLOps para modelos fundacionales.

Calificaciones Básicas

Título de licenciatura en Ciencias de la Computación, Ingeniería de Computadoras, o un campo técnico relacionado.
Más de 9 años de experiencia en programación con Python, Go, Scala o C/C++.
Más de 6 años de experiencia diseñando y desplegando aplicaciones empresariales de IA o ML.
Más de 3 años de experiencia implementando automatización del ciclo de vida completo de ML usando MLOps.
Más de 4 años liderando equipos desarrollando soluciones de Aprendizaje Automático.
Más de 1 año de experiencia con sistemas de IA conversacional basados en LLM.

Calificaciones Preferidas

Maestría o PhD en Ingeniería, Ciencias de la Computación, o un campo técnico relacionado con un enfoque en técnicas modernas de IA.
Fuertes habilidades de resolución de problemas y análisis, con la capacidad de trabajar de manera independiente y como parte de un equipo.
Experiencia con Teoría de Grafos o Redes y ML de Grafos, incluyendo frameworks como Deep Graph Learning (DGL) o NetworkX.
Experiencia diseñando plataformas distribuidas a gran escala en entornos de nube como AWS, Azure o GCP.
Experiencia construyendo SDKs abstractos y familiaridad con Haystack o Langchain.
Experiencia arquitectando sistemas en la nube para seguridad, rendimiento, escalabilidad y costo.
Experiencia entregando grandes modelos a través del ciclo de vida MLOps desde la exploración hasta la entrega.
Experiencia usando Kubeflow Pipelines para entregar modelos a producción.
Capacidad para navegar en un entorno con prioridades y plazos en competencia, preferiblemente con experiencia en empresas/startups tecnológicas y orientadas al producto.
Experiencia en áreas de la pila tecnológica de IA incluyendo ingeniería de prompts, guardrails, bases de datos vectoriales, alojamiento de LLM y ajuste fino.
Experiencia con la integración vertical