Staff AI Infrastructure Engineer

Job expired!
Oferty pracy na stanowisko Inżyniera Infrastruktury AI/ML w XPeng Motors

XPeng Motors to wiodąca chińska firma produkująca inteligentne pojazdy elektryczne (EV). Projektujemy, rozwijamy i produkujemy inteligentne EV, integrując zaawansowane technologie internetowe, AI i autonomiczną jazdę. Zobowiązani do R&D i inteligentnej produkcji w ramach firmy, dążymy do rewolucjonizowania mobilności naszych klientów dzięki technologii i danym.

Szukamy utalentowanego Inżyniera Infrastruktury AI/ML, który podniesie naszą wydajność. W tej roli będziesz identyfikować i rozwiązywać luki w infrastrukturze, aby zapewnić niezawodne, efektywne i skalowalne rozwiązania, mające wpływ na nasze operacje badawczo-rozwojowe.

  • Identyfikacja i rozwiązywanie luk w infrastrukturze dla niezawodnych i skalowalnych rozwiązań.
  • Rozwój infrastruktury AI/ML w celu zwiększenia wydajności naszych zespołów ML.
  • Projektowanie rozwiązań dla kluczowych obszarów, takich jak rozproszona pamięć masowa, systemy planowania, wysoka dostępność i podstawowa niezawodność dla dużych klastrów GPU.
  • Monitorowanie i optymalizacja wydajności infrastruktury AI/ML, zapewniające wysoką dostępność i efektywne wykorzystanie zasobów.
  • Opracowanie i wdrożenie narzędzi automatyzacji, rozwiązań monitorowania i strategii operacyjnych w celu usprawnienia zarządzania infrastrukturą.
  • Współpraca z deweloperami ML, inżynierami danych i profesjonalistami DevOps w celu stworzenia spójnego ekosystemu infrastruktury AI/ML.
  • Tytuł licencjata w dziedzinie informatyki, inżynierii lub pokrewnej dziedziny technicznej.
  • 5-8+ lat doświadczenia w inżynierii oprogramowania z dużym doświadczeniem w systemach rozproszonych na dużą skalę, najlepiej w dziedzinie AI/ML.
  • Biegłość w językach programowania takich jak Python, Go lub C++ oraz znajomość platform chmurowych jak AWS lub Azure.
  • Silne umiejętności komunikacyjne i współpracy w pracy z różnorodnymi zespołami.
  • Głębokie zrozumienie przepływów pracy AI/ML, w tym trenowania modeli, przetwarzania danych i ścieżek wnioskowania.
  • Doświadczenie z technologiami konteneryzacji (Docker, Kubernetes), narzędziami automatyzacji (Ansible, Terraform) i rozwiązaniami monitorowania (Prometheus, Grafana).
  • Wyjątkowe umiejętności rozwiązywania problemów w analizowaniu skomplikowanych systemów i wdrażaniu skalowalnych rozwiązań.
  • Pasja do ciągłego uczenia się i bycie na bieżąco z nowymi technologiami oraz najlepszymi praktykami w infrastrukturze AI/ML.
  • Przyjemne, wspierające i angażujące środowisko pracy.
  • Możliwość znaczącego wpływu na autonomiczną jazdę i rewolucję w transporcie.
  • Szansa pracy z najnowocześniejszymi technologiami i najlepszymi talentami w dziedzinie.
  • Konkurencyj