Присоединяйтесь к GE HealthCare в качестве Специалиста по обработке данных, чтобы работать над инновационными решениями в области больших данных. Вы будете разрабатывать, тестировать и внедрять процессы обработки данных для создания аналитических и отчетных решений. Тесно сотрудничайте с архитекторами для внедрения различных продуктов данных для GEHC. Управляйте и поддерживайте структуры метаданных, такие как каталоги данных, и предоставляйте необходимую поддержку в период пост-производственной деятельности, когда это необходимо. Достигайте результатов, используя гибкие методологии своевременно.
GE HealthCare является мировым лидером в области медицинских технологий и цифровых решений, стремясь создать мир, где нет границ для здравоохранения. Присоединяйтесь к нам, чтобы превратить идеи в реалии, меняющие мир, и внести свой вклад в совместную и инклюзивную среду, в которой ценится каждый голос.
В этой роли вы будете:
- Проектировать и внедрять надежные и масштабируемые конвейеры данных для систем больших данных, участвовать в технических разработках и презентовать технические идеи.
- Создавать системы производственного уровня для ETL, обработки данных, мониторинга данных и оценки качества данных с использованием различных инструментов и технологий.
- Собирать требования к аналитическим системам через мозговые штурмы с архитекторами и менеджерами по продуктам.
- Разрабатывать конвейеры данных для облачных систем BI, AI и ML, исследуя компромиссы.
- Помогать в инициативах BI, AI и ML, интерпретируя результаты количественных моделей, выявляя тенденции и разрабатывая альтернативы для поддержки бизнес-целей.
Требования:
- Степень бакалавра или магистра в области компьютерных наук.
- Более 1 года опыта работы с технологиями больших данных, экосистемой обработки данных Azure или облаком AWS, включая Databricks/Apache Spark, NoSQL и реляционные базы данных.
- Более 1 года опыта работы с сервисами AWS, такими как EC2, Databricks, S3, SQS, SNS и CloudWatch.
- Знание форматов столбцовых файлов (ORC, Parquet, Delta tables).
- Опыт работы с структурированными, полуструктурированными и неструктурированными наборами данных (форматы XML, JSON).
- Более 1 года практического опыта разработки на Java, Python, SQL, R или Scala, включая написание и оптимизацию SQL-запросов.
- Более 1 года опыта создания конвейеров данных в Databricks с использованием Python/Scala, включая написание модульных тестов, мониторинг и проверку данных.
Желательно:
- Понимание концепций BDD, CI/CD, Terraform, Docker и AI/ML.
- Знание концепций хранилищ данных, больших данных, распределенных вычислений и современных принципов архитектуры данных, таких как Data Mesh и Data Lakehouse.
- Знание инструментов анализа качества данных, таких как Great Expectations/Spark Deequ, и стандартов здравоохранения, таких как HL7, FHIR.
- Сертификация AWS Cloud Practitioner или выше.
GE Healthcare привержена инклюзивности и разнообразию, принимая решения о трудоустройстве без учета расы, цвета кожи, религии, национального или этнического происхождения, пола, сексуальной ориентации, гендерной идентичности или выражения, возраста, инвалидности, статуса защищенного ветерана или других характеристик, защищенных законом.
Мы ожидаем, что все сотрудники будут принимать наши ценности скромности, прозрачности, сосредоточенности и честности, способствуя культуре доверия, сотрудничества и поддержки.
Наша комплексная система вознаграждений разработана для реализации ваших амбиций, предоставляя гибкость, конкурентоспособные зарплаты и льготы. Вы будете окружены карьерными возможностями в поддерживающей культуре.
#L1-Hybrid