Инженер по машинному обучению

  • Full Time
Job expired!

Обзор должности

Инженер по данным создает пути для передачи данных от источника к хранилищу данных. Эти пути имеют важное значение, позволяя организации получить доступ к своим данным и анализировать их для принятия бизнес-решений. Потоки данных транспортируют и преобразуют данные в соответствии с установленными бизнес-правилами или исследовательскими анализами, которые компания хочет провести. Инженер по данным подготавливает и организует данные, которые организации накопили в своих базах данных и других форматах.

День из жизни инженера машинного обучения

День инженера по данным начинается с создания и предоставления высококачественных архитектур данных и пайплайнов для поддержки клиентов, бизнес-аналитиков и специалистов по данным. Инженеры по данным взаимодействуют с другими техническими командами для извлечения, преобразования и загрузки [ETL] данных из широкого диапазона источников данных. Успешные инженеры по данным постоянно улучшают текущие отчеты и процессы, а также автоматизируют или упрощают поддержку самообслуживания для клиентов. Инженеры по данным разрабатывают, кодируют и внедряют скрипты, написанные на Python, так как Python является основным языком для данных. Все инженеры по данным, в первую очередь, являются программистами с пониманием процесса разработки программного обеспечения (SDLC).

Основные обязанности и ответственность

  • Строить, тестировать и поддерживать архитектуры данных, предоставленные архитектором данных
  • Анализировать сырые и органические данные
  • Создавать системы данных и пайплайны
  • Разрабатывать необходимую инфраструктуру для оптимального извлечения, преобразования и загрузки данных из широкого спектра источников данных с использованием SQL и технологий "больших данных" AWS
  • Создавать код и скрипты для архитекторов данных, специалистов по данным и инженеров по контролю качества данных
  • Обеспечивать приобретение данных
  • Определять способы повышения надежности, эффективности и качества данных
  • Создавать процессы набора данных
  • Подготавливать данные для предсказательного и предписного моделирования
  • Автоматизировать процедуры сбора и анализа данных, инструменты для публикации данных и отчетности
  • Создавать алгоритмы и прототипы
  • Создавать аналитические инструменты и программы
  • Сотрудничать со специалистами по данным и архитекторами по различным проектам или инициативам

Требования

  • Бакалавр или магистр в области информатики, инженерии или смежной области
  • Сертификат специалиста по большим данным AWS
    • Необходимо иметь этот сертификат или быть готовым получить его в течение двух недель после найма
  • 5+ лет подтвержденного опыта работы в качестве инженера по данным, желательно в роли консультанта или специалиста в сфере профессиональных услуг
  • Сильная профессиональность в языках программирования, таких как Python, Java или Scala, и экспертиза в области фреймворков и библиотек для обработки данных (например, Spark, Hadoop, SQL и т.д.)
  • Глубокое понимание систем баз данных (реляционных и NoSQL), моделирования данных и концепций хранилищ данных
  • Опыт работы с облачными платформами и сервисами по работе с данными (например, AWS, Azure, Google Cloud), а также знакомство с соответствующими инструментами и технологиями (например, S3, Redshift, BigQuery и т. д.)
  • Профессиональная подготовка в области разработки и внедрения процессов ETL и потоков интеграции данных с использованием инструментов, таких как Apache Airflow, Informatica или Talend
  • Знакомство с практиками управления данными, структурами обеспечения качества данных и принципами безопасности данных
  • Сильные аналитические и проблемно-ориентированные способности, с профессиональной подготовкой в области перевода бизнес-требований в технические решения
  • Исключительные коммуникационные и коллаборативные навыки, с возможностью эффективно сотрудничать с клиентами и межфункциональными командами
  • Способность к самостоятельной и активной работе, с энтузиазмом по учению и увлечением последними разработками в области инженерии данных
  • Способность работать в условиях неоднозначности и переводить потребности и желания клиента в реализуемые истории и эпики во время спринта. Это означает, что инженеры по данным понимают "гибкий" процесс доставки программного обеспечения
  • Твердое понимание SDLC процесса
  • Понимание объектно-ориентированного программирования
  • Способность работать с минимальным руководством
  • Опыт работы с AWS
  • Настройка инженера-разработчика решений

Ключевые навыки

  • AWS Glue
  • AWS Lake Formation
  • AWS Step Functions
  • Amazon Redshift
  • Amazon S3

Предпочтительные навыки и опыт

  • Исследовательский подход при решении проблем
  • Настрой "хорошего не достаточно" для наших клиентов
  • Сертификации Snowflake или Databricks и/или практический опыт

Льготы и преимущества

Сотрудники, работающие на полную ставку, имеют право на наши программы льгот:

  • Страхование здоровья (медицинское, стоматологическое и зрение),
  • Страхование на случай временной нетрудоспособности, страхование на случай долгосрочной нетрудоспособности и страхование жизни,
  • 401k с совпадающими взносами компании
  • Оплачиваемый отпуск (до 120 часов в течение одного года)
  • Выходные в праздники (14 дней в год)
  • Все остальные предложения на усмотрение руководства и могут изменяться в любое время.

Зарплата по этой вакансии составляет от $104,900 до $149,800.

CA ID: IT10000584B

"Указанные диапазоны зарплаты предназначены только для информации и могут варьироваться в зависимости от опыта, квалификации и географического местоположения. Конечное предложение по зарплате будет определено на основе навыков кандидата и соответствия требованиями должности."

Это описание работы может не включать все возлагаемые обязанности, ответственность или аспекты работы. Оно может быть изменено в любое время по единоличному усмотрению работодателя. Задачи и обязанности могут быть скорректированы для разумного размещения лиц с инвалидностью. Для успешного выполнения этой работы необходимо иметь навыки, способности и умения, необходимые для эффективного выполнения каждой задачи. Данный документ не создает трудовой контракт, явный или подразумеваемый, кроме отношений "по согласию сторон". Effectual Inc. является работодателем, предоставляющим равные возможности (EEO) и не дискриминирует на основе какой-либо защищенной категории при найме, продвижении и других трудоустройствах.