Практическая работа с созданием признаков (включая проверку признаков, преобразование признаков, создание признаков, обслуживание и обучение базы данных, метаданные признаков и сбор артефактов), а также жизненный цикл модели машинного обучения.
Практический опыт работы с полноценным разработчиком JAVA, Python, специализация на TensorFlow, ReactJS, и ADO.
Опыт работы с реализацией Data as a Service.
Желательны сильные знания в области статистики, а также аналитические и решение задач.
Знание кэш-баз данных и векторных баз данных.
Было бы преимуществом глубокое понимание Responsible AI Workflows и управление моделями.
Применимый опыт работы с технологиями Big Data (включая Hortonworks HDP, Apache Hadoop, HDFS, Hive, Sqoop, Flume, Zookeeper и HBase, Oozie, Spark, Ni-Fi, Kafka, Snap Logic, AWS, Redshift).
Опыт работы с инструментами мониторинга.
Возможность разрабатывать с использованием языков программирования Python, Spark и R.
Отличные управленческие и аналитические навыки.
Сильные навыки письменной и устной коммуникации.
Хорошее понимание и опыт работы с методологиями проектов (например, SDLC, Agile).
Опыт проектирования и реализации ETL-каналов с использованием Apache Spark, Hive, Snowflake Structured Streaming и Python для обработки данных в режиме потока событий.
Опыт оптимизации производительности Apache Spark и Hadoop YARN.
Опыт программирования на Java.
Способность контролировать и направлять работу команд Hadoop и разработки.
Знание инструментов Camunda и Angular.
Способность отлаживать и изменять Shell-скрипт/Python.
Продуманное понимание экосистемы Big Data.
Соискатель должен также обладать прочными пониманием архитектурных шаблонов, дизайн моделей, методик оценки, настройки производительности и устранения неполадок в Big Data.
Возможность работать в режиме дежурства по выходным.
Способность сотрудничать с несколькими командами приложений и координировать решение проблем.
Сильные аналитические и межличностные навыки.
Постоянное наблюдение и управление кластером Hadoop.