Data Engineer - Great Lakes

Job expired!

Фонд CDC сотрудничает с Центрами по контролю и профилактике заболеваний (CDC), чтобы улучшить общественное здравоохранение через инновационные коллаборации с филантропами, корпорациями, организациями и частными лицами. Как авторизованный некоммерческий фонд для мобилизации ресурсов частного сектора, мы стремимся защищать здоровье, безопасность и безопасность Америки и всего мира. С 1995 года мы собрали более $1,9 миллиарда и запустили более 1 300 программ, направленных на решение множества угроз здоровью, от хронических заболеваний, таких как сердечно-сосудистые заболевания и рак, до инфекционных болезней, включая ротавирус, ВИЧ, COVID-19 и Эболу. Узнайте больше о нашем влиянии на www.cdcfoundation.org.

  • Местоположение: Удаленно (должен находиться в США)
  • Диапазон зарплаты: $115,000-$165,000, плюс льготы
  • Тип должности: Финансируемая по гранту, срочная позиция
  • Дата окончания позиции: 30 июня 2025 года

Мы ищем квалифицированного инженера по данным, который сыграет ключевую роль в продвижении миссии Фонда CDC, улучшая нашу инфраструктуру данных в Центре эпидемиологии Великих озер Межплеменного совета. Эта роль включает в себя проектирование, построение и поддержку надежных систем данных для поддержки инициатив в области общественного здравоохранения. Вы будете работать в тесном сотрудничестве с разными специалистами, включая аналитиков данных, ученых, ИТ-профессионалов, архитекторов хранилищ и многих других, чтобы предлагать масштабируемые и эффективные решения для данных.

  • Создание и управление эффективными системами и конвейерами данных для их получения, обработки и хранения.
  • Преобразование и очистка данных, полученных из различных источников, для обеспечения их точности и согласованности.
  • Загрузка данных в системы хранения или хранилища данных и оптимизация конвейеров данных для производительности и масштабируемости.
  • Мониторинг систем данных на предмет проблем с производительностью, ошибок и аномалий, а также внедрение необходимых решений.
  • Реализация мер безопасности для защиты конфиденциальной информации о здравоохранении в соответствии с регуляциями, такими как HIPAA.
  • Сотрудничество с учеными данными, аналитиками и партнерами для удовлетворения потребностей инфраструктуры данных и организационных целей.
  • Проектирование масштабируемых решений для удовлетворения бизнес-потребностей и поддержка процессов ETL для обеспечения точности данных.
  • Управление системами хранения данных, включая реляционные и NoSQL базы данных, и постоянное обновление знаний по текущим отраслевым тенденциям.
  • Предоставление технических рекомендаций персоналу и племенам по запросу, обеспечивая эффективное общение на всех уровнях.
  • Степень бакалавра в области компьютерных наук, информационных технологий, науки о данных или смежной области.
  • Знание языков программирования, таких как Python, Java, Scala или SQL.
  • Опыт работы с технологиями и фреймворками для больших данных, такими как Hadoop, Spark, Kafka и Flink.
  • Глубокое понимание реляционных баз данных (например, MySQL, PostgreSQL) и NoSQL баз данных (например, MongoDB, Cassandra).
  • Опыт работы с системой контроля версий, автоматическим тестированием, непрерывной интеграцией и практиками развертывания.
  • Знание концепций хранилищ данных и облачных решений, таких как AWS S3 и Azure.
  • Экспертиза в моделировании данных, процессах ETL и методах интеграции данных.
  • Знание методологий агильной разработки и шаблонов проектирования