Sr. Data Scientist - GenAI & LLM

Job expired!

Присоединяйтесь к нашей команде в качестве старшего научного сотрудника по данным, специализирующегося на GenAI и LLM в Databricks

Местоположение: Эта роль открыта для кандидатов на удаленной работе, с предпочтением к тем, кто находится в районе залива, хотя приглашаются кандидаты со всей территории США.

В рамках команды по работе с машинным обучением (ML), ориентированной на клиента, в Databricks, вы будете заниматься сложными проектами, связанными с моделями больших языков (LLM), и помогать предоставлять передовые решения нашему разнообразному клиентскому контингенту. Занимайтесь захватывающей работой, варьирующейся от создания ML пайплайнов до их развертывания в производственных средах и руководствуясь стратегическими ML инициативами на долгосрочную перспективу.

  • Разработка инновационных приложений LLM с использованием данных клиентов, включая, но не ограничиваясь, архитектурами RAG и натуральным языком запросов к структурированным данным.
  • Улучшение научных нагрузок по обработке данных для наших клиентов и внедрение надежных систем MLOps в различных областях.
  • Консультирование по архитектуре данных, инструментарию и лучшим практикам для команд науки о данных.
  • Представительство Databricks на ведущих технических конференциях и вклад в обучение сообщества.
  • Предоставление наставничества в сообществе ML SME и сотрудничество с нашими инженерными и продуктовыми подразделениями, чтобы помочь направить направления продукта.
  • Продвинутые знания в области обработки естественного языка, баз данных векторов, тонкой настройки LLM и развертывания с использованием инструментов, таких как HuggingFace и OpenAI.
  • Не менее 4 лет в ролях в области науки о данных, с доказанным опытом использования ML-фреймворков, таких как TensorFlow или PyTorch.
  • Доказанная способность к созданию ML-систем на облачных платформах, таких как AWS, Azure или GCP.
  • Высшее образование в количественной области или эквивалентный практический опыт, в сочетании с отличной способностью передавать сложные концепции разнообразной аудитории.
  • Глубокий дух сотрудничества и страсть к непрерывному обучению и инновациям в области машинного обучения.
  • (Предпочтительно) Опыт работы с Apache Spark™ при обработке больших объемов данных.