Data Trainer - Machine Learning & NLP

Job expired!

MindTech, пионер в области предоставления комплексных решений для обеспечения безопасности данных и соответствия требованиям, в поисках опытного Тренера по данным / Data Scientist с акцентом на машинное обучение и NLP. Наш идеальный кандидат успешно чувствует себя в высокотехнологичной среде, формируя качественные наборы данных для повышения эффективности решений, основанных на данных, в различных бизнес-доменах.

Тренер по данным / Data Scientist будет играть ключевую роль в создании и управлении мощными наборами данных, используемыми разработчиками ПО, командами QA и инженерами на местах. Основная задача заключается в создании и поддержании наборов данных, содержащих персональные данные, что крайне важно для обучения моделей ИИ и проведения тестирования QA. Хотя основная цель не заключается в разработке новых моделей, наличие навыков моделирования будет рассматриваться как ценное дополнение.

Мы ищем старшего члена команды, который может работать самостоятельно и вносить творчество в нашу деятельность, улучшая наше бизнес-предложение и решения для данных.

  • Разработка репрезентативных наборов данных, имитирующих данные клиентов для обучающих модулей, помогающих командам QA и разработчикам.
  • Извлечение чувствительных элементов данных, настроенных специально под требования продукта и клиента.
  • Подтвержденный опыт разработки сложных ETL-пайплайнов, особенно тех, которые обрабатывают текст на естественном языке и шаблоны.
  • Опыт работы с Python и инструментами, такими как pandas, numpy, Gensim, spaCy, NLTK; знание SQL и NoSQL баз данных.
  • Прилежное отношение к качеству данных и глубокое понимание различных бизнес потребностей.
  • Умение писать модульный код и участие в коллаборативных средах, включая рецензирование кода.
  • Опыт взаимодействия с разработчиками программного обеспечения, менеджерами продукта и другими заинтересованными сторонами для интеграции решений с данными и уточнения бизнес требований.
  • Сильные коммуникативные навыки с умением чётко и организованно документировать программное обеспечение и данные.
  • Опыт работы с текстовыми аналитическими пайплайнами и моделями машинного обучения, ориентированными на классификацию текста и выявление сущностей.
  • Интерес или опыт в области веб-скрапинга, автоматизированного создания конт