Sr. Distinguished Engineer, Generative AI, Platform Agents and Tooling (Remote Eligible)

Job expired!

Местоположение: 201 Третья улица, Сан-Франциско, Калифорния, США

В Capital One мы стремимся создать надежные и человеко-ориентированные системы ИИ для революции в банковском деле. Лидируя в индустрии применения машинного обучения, мы стремимся создать интеллектуальные и автоматизированные системы клиентского обслуживания в реальном времени. От уведомлений клиентов о необычных расходах до предоставления помощи в реальном времени — наши приложения на основе ИИ упрощают и гуманизируют банковское обслуживание.

Благодаря нашим инвестициям в общеоблачную инфраструктуру и платформы машинного обучения, мы находимся в уникальном положении, чтобы использовать преобразующую мощь ИИ. Мы стремимся создавать исключительные команды прикладных наук и инженерии, продолжая наши передовые возможности в индустрии и предоставляя масштабируемую и высокопроизводительную инфраструктуру ИИ.

Мы ищем опытного старшего выдающегося инженера по платформам ИИ, который поможет нам создать основу наших корпоративных возможностей ИИ. В этой роли вы будете развивать универсальные платформенные сервисы для поддержки приложений, управляемых генеративным ИИ, создавать SDK и API, разрабатывать агентов информационного поиска и модели как услугу для оптимизации LLM через RAG, а также выполнять другие задачи. Вы также будете управлять полной координацией с операциями, курировать высококачественные наборы данных и помогать внедрять модели в производство. Ваша работа с командами прикладных исследований и продуктов поможет выявлять и приоритизировать текущие и будущие сервисы.

  • Разработка абстрактных платформенных сервисов для поддержки приложений, управляемых генеративным ИИ.
  • Создание SDK и API для приложений, включая информационный поиск, выявление мошенничества, ИИ-ассистенты, рекомендации и многое другое на наших платформах ИИ.
  • Проектирование и создание оркестраций платформы RAG, включая разработку подсказок, защитных средств, векторных баз данных и закрепления API.
  • Создание службы управления подсказками через межорганизационные партнерства.
  • Оставаться в курсе последних достижений в области операционного внедрения машинного обучения и технологий генеративного ИИ.
  • Реализация возможностей для поддержки MLOps для базовых моделей.
  • Степень бакалавра в области компьютерных наук, компьютерной инженерии или смежной технической специализации.
  • Более 9 лет опыта программирования на Python, Go, Scala или C/C++.
  • Более 6 лет опыта проектирования и развертывания корпоративных приложений ИИ или МЛ.
  • Более 3 лет опыта внедрения полного жизненного цикла автоматизации МЛ с использованием MLOps.
  • Более 4 лет руководства командами, разрабатывающими решения машинного обучения.
  • Более 1 года опыта работы с системами разговорного ИИ на основе LLM.
  • Степень магистра или доктора наук в области инженерии, компьютерных наук или смежного технического направления с акцентом на современные методы ИИ.
  • Сильные аналитические и проблемно-ориентированные навыки, способности работать как самостоятельно, так и в команде.
  • Опыт работы с теорией графов или сетей и Graph ML, включая такие фреймворки, как Deep Graph Learning (DGL) или NetworkX.
  • Опыт проектирования крупномасштабных распределенных платформ в облачных средах, таких как AWS, Azure или GCP.
  • Опыт создания абстрактных SDK и знакомство с Haystack или Langchain.
  • Опыт проектирования облачных систем для безопасности, производительности, масштабируемости и снижения затрат.
  • Опыт доставки крупных моделей через жизненный цикл MLOps: от исследований до обслуживания.
  • Опыт использования Kubeflow Pipelines для подачи моделей в производство.
  • Способность работать в среде с конкурирующими приоритетами и срок