[Job- 15824] Senior Data Scientist - NLP

Job expired!

Присоединяйтесь к мировому лидеру в цифровой трансформации! В CI&T мы сотрудничаем с самыми уважаемыми брендами мира, чтобы создавать инновационные цифровые решения, которые революционизируют бизнес. С 29-летним наследием достижения бизнес-результатов, наша команда из более чем 6000 профессионалов по всему миру специализируется на стратегии, исследованиях, науке о данных, дизайне и инженерии для стимулирования роста, улучшения клиентского опыта и оптимизации операционной эффективности.

CI&T ищет опытных ученых данных с экспертизой в области обработки естественного языка (NLP) для руководства инициативами в области ИИ в американской сфере здравоохранения. Как ключевой игрок, вы будете способствовать бизнес-эффекту, используя новейшие решения ИИ.

  • Проводить исследование данных для подтверждения требований и качества данных в контексте NLP.
  • Выполнять предобработку NLP, включая токенизацию, лексический анализ, синтаксический анализ, семантический анализ и прагматический анализ.
  • Определять и согласовывать лучшие модели NLP с ожидаемыми результатами бизнеса.
  • Обучать и проверять модели, используя метрики, такие как точность, прецизионность, отзывчивость, F1-score и ROUGE score.
  • Документировать процессы разработки моделей, методологии и результаты для всех заинтересованных сторон.
  • Реализовывать классификацию текста и анализ настроений с использованием традиционных классификаторов машинного обучения и моделей глубокого обучения.
  • Улучшать производительность моделей NLP через тщательные эксперименты и анализ.
  • Применять техники тематического моделирования, такие как LDA и NMF, для выявления абстрактных тем из текстовых данных.
  • Понимать и применять модели последовательного к последовательному для машинного перевода, суммаризации текста и задач вопрос-ответ.
  • Свободное владение устной и письменной речью на английском языке.
  • Опыт работы в международных проектах и роль ученого данных в проектах NLP.
  • Экспертиза в Python, сосредоточенность на пакетах, таких как NLTK, spaCy и Gensim.
  • Опыт в техниках, таких как извлечение тем, суммаризация, категоризация и анализ настроений.
  • Сильные навыки решения проблем и креативность в применении техник NLP к реальным задачам.
  • Осведомленность об этических аспектах в NLP, включая предвзятость, конфиденциальность и социальные воздействия.
  • Профессионализм на всех этапах процесса науки о данных, от сбора данных до развертывания.
  • Опыт работы с большими объемами данных, их анализом и визуализацией с использованием инструментов, таких как SQL и Python.
  • Опыт с увеличением данных.
  • Знание трансформеров, BERT и распознавания именованных сущностей (NER).
  • Опыт в области инженерии данных.
  • Опыт работы с MLOps и сервисами Azure.
  • Профессионализм в Databricks.
  • Знание нормативов по защите данных, таких как PII, CCPA и HIPAA.
  • Планы медицинского и стоматологического страхования.
  • Пособия на питание.
  • Пособия для детей.
  • Продленный отпуск по уходу за ребенком.
  • Абонемент в Gympass.
  • Ежегодное участие в прибыли.
  • Страхование жизни.
  • Доступ к онлайн-платформе психического здоровья.
  • CI&T University.
  • Скидочный клуб.
  • Программы поддержки: юридическая, финансовая, физиотерап