Инженер по данным

  • Full Time
Job expired!
STEMBoard - это компания по созданию технологических решений, предлагающая умные системы и программные решения для правительственных и крупномасштабных частных клиентов. Мы быстро растем и ищем увлеченных, новаторских людей, которые любят технологии и готовы оказывать значительное влияние. Что вы можете ожидать от нас: - Вы будете работать с потрясающими людьми, которые увлечены своей работой; нашу команду составляют известные авторы, обладатели патентов и международно признанные инженеры. - Мы ценим наших сотрудников и вкладываемся в их профессиональный рост, а также поощряем творчество. - С первого дня каждый сотрудник имеет право на премию и получает 20 дней оплачиваемого отпуска. - Мы вкладываемся в сообщество через активную образовательную программу и программу сетевого взаимодействия STEMBoard, которая обучает инженерии исторически недостаточно представленные сегменты населения. Основные обязанности и ответственность: Должность инженера по работе с данными требует глубокого понимания оптимизации производительности и построения данных. Помимо основных навыков аналитика данных, инженеры по работе с данными могут сделать сырые данные более полезными для предприятия. Инженеры по данным могут создавать и интегрировать интерфейсы программирования приложений (API). Их технические навыки часто включают владение несколькими языками программирования и обширные знания в области проектирования SQL-баз данных. Роль инженера по данным требует более глубоких знаний программирования для интеграции сложных моделей и использования продвинутых фреймворков программных библиотек для распределения больших, кластерных наборов данных. Инженеры по данным собирают и организовывают данные в форме, удобной для аналитики. Базовые знания в области машинного обучения также важны для построения эффективных и точных пайплайнов данных для удовлетворения потребностей конечных пользователей, таких как ученые в области данных, создающие модели и аналитику для получения людей. Инженер по работе с данными будет выполнять следующие задачи: - Разрабатывать, поддерживать и тестировать инфраструктуры для генерации данных для трансформации данных из различных структурированных и неструктурированных источников данных. - Разрабатывать сложные запросы для обеспечения доступности, оптимизируя производительность инфраструктуры NoSQL и / или больших данных. Создавать и поддерживать оптимальную архитектуру пайплайна данных. - Строить и поддерживать инфраструктуру для поддержки извлечения, преобразования и загрузки (ETL) данных из множества источников данных. Извлекать данные из нескольких источников данных, реляционных SQL и NoSQL баз данных, и других API платформ для интеграции и усвоения данных. - Настраивать и управлять фреймворками и пайплайнами аналитики данных с использованием баз данных и инструментов, таких как NoSQL, SQL, HDInsight, MongoDB, Cassandra, Neo4j, GraphDB, OrientDB, Spark, Hadoop, Kafka, Hive и Pig. - Применять принципы и концепции распределенных систем, такие как согласованность и доступность, живучесть и безопасность, устойчивость, надежность, отказоустойчивость и алгоритмы консенсуса. - Управлять облачными вычислениями и пайплайнами CI / CD, включая Azure, Google и Amazon Web Service (AWS). - Сотрудничать с заинтересованными сторонами, включая продуктовые, данные и дизайнерские команды, чтобы помочь с техническими вопросами, связанными с данными, и поддержать их потребности в инфраструктуре данных. Требования - Опыт: 1+ года работы в области программного обеспечения, данных или связанных с ними областях. - Образование: бакалавр или выше в области STEM, предпочтительно компьютерные науки или программная инженерия. - Инструменты: владение одним или несколькими языками программирования (Java, C ++, Python, R и т. Д.) - Допуск к секретности: минимальный уровень TOP SECRET. - Доказанный опыт работы с структурами данных, управлением базами данных, распределенными вычислениями и архитектурами на основе API с использованием SQL и No-SQL. - Уверенное владение фреймворками моделирования, такими как Universal Modeling Language (UML), Agile Development и операции Git. Преимущества - Страхование здоровья, зрения и зубов - 20 дней оплачиваемого отпуска - Совпадение 401К - Возмещение затрат на обучение / сертификацию - Краткосрочная / долгосрочная инвалидность - Родительский / декретный отпуск - Страхование жизни STEMBoard стремится к найму и удержанию разнообразного персонала. Все квалифицированные кандидаты будут рассмотрены для трудоустройства без учета инвалидности, статуса защищенного ветерана, расы, цвета кожи, религиозного кредо, национального происхождения, гражданства, семейного положения, пола, сексуальной ориентации / гендерной идентичности, возраста или генетической информации. Любой выбранный кандидат будет предметом обязательной проверки прошлого. STEMBoard является работодателем, предоставляющим равные возможности / с действующей программой аффирмативного действия.