Местоположение: 201 Третья улица, Сан-Франциско, Калифорния, США
В Capital One мы стремимся создать надежные и человеко-ориентированные системы ИИ для революции в банковском деле. Лидируя в индустрии применения машинного обучения, мы стремимся создать интеллектуальные и автоматизированные системы клиентского обслуживания в реальном времени. От уведомлений клиентов о необычных расходах до предоставления помощи в реальном времени — наши приложения на основе ИИ упрощают и гуманизируют банковское обслуживание.
Благодаря нашим инвестициям в общеоблачную инфраструктуру и платформы машинного обучения, мы находимся в уникальном положении, чтобы использовать преобразующую мощь ИИ. Мы стремимся создавать исключительные команды прикладных наук и инженерии, продолжая наши передовые возможности в индустрии и предоставляя масштабируемую и высокопроизводительную инфраструктуру ИИ.
Мы ищем опытного старшего выдающегося инженера по платформам ИИ, который поможет нам создать основу наших корпоративных возможностей ИИ. В этой роли вы будете развивать универсальные платформенные сервисы для поддержки приложений, управляемых генеративным ИИ, создавать SDK и API, разрабатывать агентов информационного поиска и модели как услугу для оптимизации LLM через RAG, а также выполнять другие задачи. Вы также будете управлять полной координацией с операциями, курировать высококачественные наборы данных и помогать внедрять модели в производство. Ваша работа с командами прикладных исследований и продуктов поможет выявлять и приоритизировать текущие и будущие сервисы.
- Разработка абстрактных платформенных сервисов для поддержки приложений, управляемых генеративным ИИ.
- Создание SDK и API для приложений, включая информационный поиск, выявление мошенничества, ИИ-ассистенты, рекомендации и многое другое на наших платформах ИИ.
- Проектирование и создание оркестраций платформы RAG, включая разработку подсказок, защитных средств, векторных баз данных и закрепления API.
- Создание службы управления подсказками через межорганизационные партнерства.
- Оставаться в курсе последних достижений в области операционного внедрения машинного обучения и технологий генеративного ИИ.
- Реализация возможностей для поддержки MLOps для базовых моделей.
- Степень бакалавра в области компьютерных наук, компьютерной инженерии или смежной технической специализации.
- Более 9 лет опыта программирования на Python, Go, Scala или C/C++.
- Более 6 лет опыта проектирования и развертывания корпоративных приложений ИИ или МЛ.
- Более 3 лет опыта внедрения полного жизненного цикла автоматизации МЛ с использованием MLOps.
- Более 4 лет руководства командами, разрабатывающими решения машинного обучения.
- Более 1 года опыта работы с системами разговорного ИИ на основе LLM.
- Степень магистра или доктора наук в области инженерии, компьютерных наук или смежного технического направления с акцентом на современные методы ИИ.
- Сильные аналитические и проблемно-ориентированные навыки, способности работать как самостоятельно, так и в команде.
- Опыт работы с теорией графов или сетей и Graph ML, включая такие фреймворки, как Deep Graph Learning (DGL) или NetworkX.
- Опыт проектирования крупномасштабных распределенных платформ в облачных средах, таких как AWS, Azure или GCP.
- Опыт создания абстрактных SDK и знакомство с Haystack или Langchain.
- Опыт проектирования облачных систем для безопасности, производительности, масштабируемости и снижения затрат.
- Опыт доставки крупных моделей через жизненный цикл MLOps: от исследований до обслуживания.
- Опыт использования Kubeflow Pipelines для подачи моделей в производство.
- Способность работать в среде с конкурирующими приоритетами и срок