Oracle + PySpark Data Engineer (Remote)

Job expired!

Присоединяйтесь к нашей команде: инженер/аналитик по данным Oracle + PySpark (удаленная работа) в PradeepIT Consulting Services Pvt Ltd

Описание вакансии:

В настоящее время мы в поиске опытного инженера/аналитика по данным Oracle + PySpark с профессиональным опытом от 5 до 7 лет. Вы станете ключевым элементом нашей команды данных, где сможете использовать свои навыки для управления, преобразования и анализа больших объемов данных для поддержки сложных процессов принятия решений. Это отличная возможность для специалистов, владеющих навыками поддержания целостности данных, оптимизации потоков данных и создания структур, основанных на данных.

Основные обязанности:

  • Интеграция данных: Выполнение интеграции различных источников данных в базы данных Oracle и построение эффективных данных конвейеров PySpark для аналитики и преобразования.
  • Преобразование данных: Разработка, внедрение и обслуживание динамических процессов PySpark для очистки, обогащения и организации данных для аналитических исследований.
  • Моделирование данных: Построение и постоянное улучшение моделей данных в Oracle для обеспечения оптимальной структуризации и индексации для повышения производительности запросов.
  • Оптимизация запросов: Составление сложных SQL-запросов и скриптов PySpark, настроенных для быстрой извлечения данных и упрощенной обработки.
  • Анализ данных: Тесное сотрудничество с аналитиками данных и бизнес-подразделениями для выявления выводов с помощью устойчивой аналитики данных и всесторонней отчетности.
  • Качество данных: Инициирование внедрения строгих контрольных мер, управления ошибками и протоколов проверки для обеспечения надежности и точности данных.
  • Настройка производительности: Тонкая настройка настроек Oracle и работ PySpark для повышения эффективности обработки и общей производительности.

Требуемые технические навыки:

  • Доказанный опыт работы с базами данных Oracle и приложениями PySpark.
  • Прочное знание SQL, PL/SQL, Python и PySpark.
  • Навыки управления базами данных Oracle, хранилищами данных и процессами ETL.
  • Знание технологий обработки больших данных и принципов распределенных вычислений.
  • Выдающиеся аналитические, умения поиска и устранения неисправностей и навыки решения проблем.
  • Эффективные коммуникативные навыки и способность к командной работе.