Senior ML Engineer - Machine Learning Platform

Job expired!

Opis Stanowiska

Jesteś gotowy wykorzystać swoje umiejętności technologiczne, aby przekształcić sposób budowania społeczności, szpitali, domów, stadionów sportowych i szkół na całym świecie? Dołącz do Procore Technologies i bądź częścią rewolucji w jednej z najmniej zdigitalizowanych i najbardziej niebezpiecznych branż: budownictwie.

Szukamy utalentowanego Starszego Inżyniera ML, który dołączy do naszego zespołu Platformy ML. W tej roli, zlokalizowanej w Kairze, pomożesz rozwijać naszą platformę Uczenia Maszynowego, aby wspierać setki modeli. Będziesz wdrażać usługi do publikowania modeli AI i nauki o danych zdolnych do przetwarzania terabajtów danych. Twoja praca będzie obejmować jednokrotne i bieżące automatyczne szkolenie modeli, wdrażanie i monitorowanie, a także zarządzanie repozytoriami modeli, magazynami funkcji i warstwami dostępu do danych.

Szukamy osoby, która dołączy do nas natychmiast. Stanowisko to będzie raportować do Menedżera Inżynierii, Platforma ML.

  • Sprawdzanie procesów wdrażania dla modeli ML.
  • Przeglądanie zmian w kodzie i żądań pull od zespołu nauki o danych.
  • Uruchamianie pipeline'ów CI/CD po zatwierdzeniu kodu.
  • Monitorowanie pipeline'ów i zapewnienie, że testy przechodzą pomyślnie, a artefakty modeli są generowane i przechowywane poprawnie.
  • Wdrażanie zaktualizowanych modeli do produkcji po zakończeniu pipeline'u.
  • Współpraca z zespołami inżynierii oprogramowania i DevOps w celu sprawnej integracji.
  • Konteneryzacja modeli za pomocą Dockera i wdrażanie na platformach chmurowych (AWS/GCP/Azure).
  • Konfigurowanie narzędzi monitorujących do śledzenia metryk, takich jak czas odpowiedzi, wskaźniki błędów i wykorzystanie zasobów.
  • Ustanawianie alertów i powiadomień w celu szybkiego wykrywania anomalii.
  • Współpraca z zespołem nauki o danych przy aktualizacji pipeline'ów i analizie danych monitoringu, logów i metryk.
  • Dokumentowanie i rozwiązywanie problemów oraz strategii optymalizacji.
  • Praca z zespołami Produktu, UX i Prototypowania w celu wpływania na harmonogram produktu.
  • Biegłość w językach programowania takich jak Python, Java i C++.
  • Doświadczenie z frameworkami uczenia maszynowego jak TensorFlow i PyTorch.
  • Praktyczne doświadczenie w cyklu życia uczenia maszynowego: przetwarzanie danych, ekstrakcja cech, szkolenie modeli, ocena, wdrażanie i monitorowanie.
  • Znajomość ekosystemu open-source, w tym TensorFlow, PyTorch, MLflow, Ray, Kubeflow i TFX, jest mile widziana.
  • Doświadczenie w tworzeniu dużych, rozproszonych, odpornych na błędy i skalowalnych systemów przetwarzania danych używających przetwarzania wsadowego ze Spark lub strumieniowego z Flink lub Kafka Streams.
  • Zdolność do pracy i komunikowania się skutecznie z naukowcami danych oraz tłumaczenia problemów nauki o danych na konkretne potrzeby dotyczące danych, infrastruktury lub przepływu pracy.
  • Solidne zrozumienie pipeline'ów CI/CD używających Jenkins i narzędzi IaC jak Terraform i CloudFormation.
  • Znajomość koncepcji bezpieczeństwa, takich jak firewalle, szyfrowanie