Основные моменты:
- Местоположение: Удаленно, необходимо проживание в США
- Диапазон зарплат: $115,000-$165,000, плюс льготы
- Тип должности: Должность с финансированием от грантов, ограниченная по срокам
- Дата окончания должности: 30 июня 2025 г.
Фонд CDC ищет квалифицированного инженера данных для поддержки отдела общественного здравоохранения Аляски, секции общественного здравоохранения. Эта роль имеет ключевое значение для проектирования, создания и обслуживания инфраструктуры данных при переходе на новую систему электронных медицинских записей (EHR). Данная позиция сосредоточена на преобразовании и загрузке данных, создании единой, ориентированной на пациента базы данных для замены текущей системы, основанной на местоположении. Основные обязанности включают сложные задачи ETL, сопоставление данных, их трансформацию, очистку и подготовку к эффективному импорту с минимальным временем простоя. Важна совместная работа с экспертами по данным, ИТ-персоналом и сотрудниками организации для обеспечения соответствия новой системы потребностям отдела. Работа полностью удаленная в пределах США.
- Установление отношений между разрозненными базами данных для обеспечения точной и эффективной консолидации данных.
- Создание и управление системами и конвейерами для эффективного потока данных, включая их сбор, обработку и хранение.
- Сбор, преобразование и очистка данных для обеспечения их точности и согласованности, а также загрузка данных в системы хранения или хранилища данных.
- Оптимизация конвейеров данных, инфраструктуры и рабочих процессов для повышения производительности и масштабируемости.
- Мониторинг конвейеров данных на предмет проблем с производительностью, ошибок и аномалий, а также реализация решений.
- Внедрение мер безопасности для защиты конфиденциальной информации и обеспечения соответствия нормативным требованиям, особенно HIPAA.
- Сотрудничество с учеными, аналитиками данных и другими партнерами для понимания их потребностей в данных и обеспечения соответствия инфраструктуры данных целям организации.
- Внедрение и поддержка процессов ETL для обеспечения точности, полноты и согласованности данных.
- Проектирование и управление системами хранения данных, включая реляционные базы данных, базы данных NoSQL и хранилища данных.
- Создание диаграмм архитектуры систем, документации и руководств для коммуникации проектных решений и передовых практик.
- Актуализация знаний о тенденциях отрасли, передовых практиках и новых технологиях в области инженерии данных и их интеграция в инфраструктуру данных организации.
- Предоставление технических консультаций другим сотрудникам.
- Эффективное общение с партнерами для сбора требований, предоставления обновлений и представления результатов.
- Степень бакалавра в области компьютерных наук, информационных технологий, науки о данных или смежной области.
- Обширный опыт работы с SQL, Python, C#, Java, Data Warehouse и создания масштабируемых ETL конвейеров.
- Знание передовых практик в инженерии, таких как управление версиями, автоматизированное тестирование, непрерывная интеграция и деплоймент, а также проведение экспертных оценок.
- Знакомство с системами трансформации данных (DTS) для переноса данных в системы SQL Server.
- Знание методов дедупликации данных и поддержания их качества.
- Опыт в моделировании данных и переходе от систем, основанных на местоположении, к системам, ориентированным на человека, желательно в области здравоохранения.
- Предпочтительные навыки включают опыт работы с извлечением данных из MUMPS DB/VA Fileman и иерархическими системами баз данных.