Opis Stanowiska
Jesteś gotowy wykorzystać swoje umiejętności technologiczne, aby przekształcić sposób budowania społeczności, szpitali, domów, stadionów sportowych i szkół na całym świecie? Dołącz do Procore Technologies i bądź częścią rewolucji w jednej z najmniej zdigitalizowanych i najbardziej niebezpiecznych branż: budownictwie.
Szukamy utalentowanego Starszego Inżyniera ML, który dołączy do naszego zespołu Platformy ML. W tej roli, zlokalizowanej w Kairze, pomożesz rozwijać naszą platformę Uczenia Maszynowego, aby wspierać setki modeli. Będziesz wdrażać usługi do publikowania modeli AI i nauki o danych zdolnych do przetwarzania terabajtów danych. Twoja praca będzie obejmować jednokrotne i bieżące automatyczne szkolenie modeli, wdrażanie i monitorowanie, a także zarządzanie repozytoriami modeli, magazynami funkcji i warstwami dostępu do danych.
Szukamy osoby, która dołączy do nas natychmiast. Stanowisko to będzie raportować do Menedżera Inżynierii, Platforma ML.
- Sprawdzanie procesów wdrażania dla modeli ML.
- Przeglądanie zmian w kodzie i żądań pull od zespołu nauki o danych.
- Uruchamianie pipeline'ów CI/CD po zatwierdzeniu kodu.
- Monitorowanie pipeline'ów i zapewnienie, że testy przechodzą pomyślnie, a artefakty modeli są generowane i przechowywane poprawnie.
- Wdrażanie zaktualizowanych modeli do produkcji po zakończeniu pipeline'u.
- Współpraca z zespołami inżynierii oprogramowania i DevOps w celu sprawnej integracji.
- Konteneryzacja modeli za pomocą Dockera i wdrażanie na platformach chmurowych (AWS/GCP/Azure).
- Konfigurowanie narzędzi monitorujących do śledzenia metryk, takich jak czas odpowiedzi, wskaźniki błędów i wykorzystanie zasobów.
- Ustanawianie alertów i powiadomień w celu szybkiego wykrywania anomalii.
- Współpraca z zespołem nauki o danych przy aktualizacji pipeline'ów i analizie danych monitoringu, logów i metryk.
- Dokumentowanie i rozwiązywanie problemów oraz strategii optymalizacji.
- Praca z zespołami Produktu, UX i Prototypowania w celu wpływania na harmonogram produktu.
- Biegłość w językach programowania takich jak Python, Java i C++.
- Doświadczenie z frameworkami uczenia maszynowego jak TensorFlow i PyTorch.
- Praktyczne doświadczenie w cyklu życia uczenia maszynowego: przetwarzanie danych, ekstrakcja cech, szkolenie modeli, ocena, wdrażanie i monitorowanie.
- Znajomość ekosystemu open-source, w tym TensorFlow, PyTorch, MLflow, Ray, Kubeflow i TFX, jest mile widziana.
- Doświadczenie w tworzeniu dużych, rozproszonych, odpornych na błędy i skalowalnych systemów przetwarzania danych używających przetwarzania wsadowego ze Spark lub strumieniowego z Flink lub Kafka Streams.
- Zdolność do pracy i komunikowania się skutecznie z naukowcami danych oraz tłumaczenia problemów nauki o danych na konkretne potrzeby dotyczące danych, infrastruktury lub przepływu pracy.
- Solidne zrozumienie pipeline'ów CI/CD używających Jenkins i narzędzi IaC jak Terraform i CloudFormation.
- Znajomość koncepcji bezpieczeństwa, takich jak firewalle, szyfrowanie