NLP/gen-AI Senior Data Scientist

Job expired!

Описание компании

Мы - Sportradar, мировой лидер в области спортивных технологий, занимающий стратегически важное положение на пересечении спорта, медиа и ставок. Нашими услугами доверяют более 1700 спортивных федераций, медиакомпаний, организаций, занимающихся ставками, и потребительских платформ. Наша технология и экспертиза охватывают более чем 120 стран, помогая заинтересованным сторонам расширять их операции.

Описание работы

В Sportradar мы приглашаем Старшего специалиста по данным в области NLP/Gen-AI присоединиться к нашей новаторской команде. Займитесь разработкой и созданием данных для спортивных продуктов и услуг вместе с всемирно известными экспертами. Погрузитесь в обширные спортивные данные для создания генеративных и предсказательных моделей, которые повышают вовлеченность любителей спорта. Работайте в тесном сотрудничестве с владельцами продуктов и техническими руководителями в нашем подразделении инструментов развлечений для ставок, смещая границы возможного в спорте и развлечениях на ставках.

Задачи:

  • Разработка предсказательных моделей и приложений на основе крупных языковых моделей (LLM) для наших спортивных предложений.
  • Проведение строгой проверки методов, моделей и алгоритмов через обратное тестирование исторических данных и симуляции.
  • Инновации в интеграции данных для повышения качества продуктов и услуг.
  • Получение значимых выводов путем объединения разнообразных источников и форматов данных.
  • Обеспечение четкой коммуникации идей и прототипов разработчикам программного обеспечения и заинтересованным сторонам в бизнесе.

Ваш профиль:

  • Доказанный опыт в машинном обучении/статистике и манипуляциях с большими данными, включая процессы статистической валидации.
  • Владение Python, с твердым пониманием лучших практик разработки программного обеспечения.
  • Знание SQL и опыт работы с формулировкой задач и тонкой настройкой языковых моделей.
  • Желательно: опыт разработки с Java, создание приложений с использованием LLM и знакомство с фреймворками, такими как LangChain или LLamaIndex.
  • Знание больших данных (например, Flink, Spark) и облачных решений (например, AWS S3, Redshift, Athena) является преимуществом. <