Senior AI and ML Infra Engineer, Research Clusters

Job expired!

Czy pasjonujesz się sztuczną inteligencją i uczeniem maszynowym? NVIDIA w Santa Clara, CA, USA szuka doświadczonego Inżyniera Infrastruktury AI/ML, aby wzmocnić nasze zaawansowane technologicznie rozwiązania. Jest to nieporównywalna okazja, aby dołączyć do zespołu, który jest na czołówce technologii AI/ML, napędzając innowacje, które mają wpływ na świat.

Jako Starszy Inżynier Infrastruktury AI i ML, Twoim głównym zadaniem będzie zwiększenie produktywności naszych zespołów badawczych poprzez identyfikację i rozwiązywanie luk w infrastrukturze. Obejmuje to projektowanie i implementację rozwiązań w celu poprawy skalowalności, niezawodności i efektywności naszych dużych klastrów GPU oraz innych kluczowych systemów.

  • Zrozumienie potrzeb infrastrukturalnych zespołów badawczych AI/ML i przekładanie ich na potężne ulepszenia.
  • Projektowanie rozwiązań do zarządzania pamięcią, przypisywania błędów i kwestii niezawodności w naszych klastrach GPU.
  • Optymalizacja wydajności infrastruktury AI/ML i wykorzystania zasobów poprzez ciągłe monitorowanie i modernizację.
  • Tworzenie narzędzi automatyzacji i strategii operacyjnych w celu minimalizacji zadań ręcznych i uproszczenia zarządzania infrastrukturą.
  • Współpraca z zespołami interdyscyplinarnymi, aby zapewnić spójny i solidny ekosystem infrastruktury AI/ML.
  • Bycie na bieżąco z najnowszymi postępami w technologiach AI/ML i włączanie ich do strategii NVIDIA.

Szukamy kogoś z licencjatem lub równoważnym (preferowane magisterskie) w dziedzinie informatyki lub pokrewnych, popartym co najmniej 12-letnim doświadczeniem. Powinieneś posiadać solidne tło w inżynierii oprogramowania z głębokim zrozumieniem wysoko skalowanych systemów dystrybuowanych, najlepiej w infrastrukturach AI/ML.

  • Biegłość w językach programowania takich jak Python, Go lub C++.
  • Znajomość platform chmurowych takich jak AWS, GCP czy Azure.
  • Doświadczenie z Docker, Kubernetes, Ansible, Terraform, Prometheus, Grafana i innymi podobnymi narzędziami.
  • Głębokie zrozumienie przepływów pracy AI/ML od przetwarzania danych po szkolenie modeli i wnioskowanie.
  • Silne umiejętności rozwiązywania problemów i zdolność tworzenia skalowalnych rozwiązań dla złożonych systemów.
  • Świetne zdolności komunikacyjne i umiejętność współpracy w zespole.

W NVIDIA oferujemy konkurencyjny pakiet wynagrodzeń zawierający atrakcyjne wynagrodzenie bazowe w przedziale od 220 000 do 419 750 dolarów, odzwierciedlające Twoje doświadczenie i rolę w firmie. Dodatkowo będziesz uprawniony do pakietu akcji i kompleksowego pakietu świadczeń wspierających zdrowie, dobrostan i bezpieczeństwo finansowe.

Nasz zespół składa się z niektórych z