Присоединяйтесь к нашей команде в качестве старшего научного сотрудника по данным, специализирующегося на GenAI и LLM в Databricks
Местоположение: Эта роль открыта для кандидатов на удаленной работе, с предпочтением к тем, кто находится в районе залива, хотя приглашаются кандидаты со всей территории США.
В рамках команды по работе с машинным обучением (ML), ориентированной на клиента, в Databricks, вы будете заниматься сложными проектами, связанными с моделями больших языков (LLM), и помогать предоставлять передовые решения нашему разнообразному клиентскому контингенту. Занимайтесь захватывающей работой, варьирующейся от создания ML пайплайнов до их развертывания в производственных средах и руководствуясь стратегическими ML инициативами на долгосрочную перспективу.
- Разработка инновационных приложений LLM с использованием данных клиентов, включая, но не ограничиваясь, архитектурами RAG и натуральным языком запросов к структурированным данным.
- Улучшение научных нагрузок по обработке данных для наших клиентов и внедрение надежных систем MLOps в различных областях.
- Консультирование по архитектуре данных, инструментарию и лучшим практикам для команд науки о данных.
- Представительство Databricks на ведущих технических конференциях и вклад в обучение сообщества.
- Предоставление наставничества в сообществе ML SME и сотрудничество с нашими инженерными и продуктовыми подразделениями, чтобы помочь направить направления продукта.
- Продвинутые знания в области обработки естественного языка, баз данных векторов, тонкой настройки LLM и развертывания с использованием инструментов, таких как HuggingFace и OpenAI.
- Не менее 4 лет в ролях в области науки о данных, с доказанным опытом использования ML-фреймворков, таких как TensorFlow или PyTorch.
- Доказанная способность к созданию ML-систем на облачных платформах, таких как AWS, Azure или GCP.
- Высшее образование в количественной области или эквивалентный практический опыт, в сочетании с отличной способностью передавать сложные концепции разнообразной аудитории.
- Глубокий дух сотрудничества и страсть к непрерывному обучению и инновациям в области машинного обучения.
- (Предпочтительно) Опыт работы с Apache Spark™ при обработке больших объемов данных.