Tech Lead Manager (TLM) - Supercomputing Scalability

Job expired!

O zespole

Superkomputery są siłą napędową umożliwiającą główne przełomy w technologii, a w OpenAI przesuwamy granice tego, co mogą zrobić te giganty. Nasz filar skalowalności superkomputerów jest poświęcony na nowo definiowaniu infrastruktury superkomputerów o skali klastra. Skupiamy się na zwiększaniu skalowalności poza istniejące liczebności węzłów, szybkim wdrażaniu aktualizacji na całym klastrze, integracji wszechstronnej telemetrii oraz włączaniu najnowocześniejszego sprzętu wspierającego przedsięwzięcia skalowania światowej klasy.

Na temat roli

Jako Kierownik Techniczny (Tech Lead Manager, TLM) w ramach Pilaru Scalability w OpenAI, z siedzibą w tętniącym życiem San Francisco, CA, poprowadzisz działania mające na celu usprawnienie i rozszerzenie możliwości superkomputerów na skalę centrów danych (DC). Pod Twoim kierownictwem nasz zespół będzie używał i przekraczał granice powszechnie dostępnych narzędzi, stawiał czoła nowym wyzwaniom sprzętowym oraz zarządzał rosnącymi klastrami superkomputerów i bazami użytkowników. Jest to rola hybrydowa, wymagająca trzech dni współpracy stacjonarnej tygodniowo, przy czym dla wybranych kandydatów dostępna jest pomoc w relokacji.

  • Bezpośrednie zarządzanie indywidualnymi współpracownikami (ICs) kształtującymi podstawy naszej skalowalności superkomputerów.
  • Pielęgnowanie wydajnego, zwinne środowiska zespołowego w celu globalnego rozwoju naszej technologii superkomputerowej, przy jednoczesnym priorytecie bezpieczeństwa i niezawodności.
  • Udoskonalanie orkiestracji i ram monitorowania dla wydajności superkomputerów najwyższej klasy.
  • Popieranie automatyzacji, aby uzyskać bezprecedensową kontrolę nad naszym stos technologicznym.
  • Pogłębianie naszego zrozumienia zdrowia i użyteczności superkomputera dla przełomowych badań i szkoleń modeli.

Jesteś idealny do tej roli, jeśli:

  • Posiadasz solidną wiedzę na temat Kubernetes (k8s) i systemów orkiestracji klastrów.
  • Wyróżniasz się w rozwoju oprogramowania i masz doświadczenie w pracy z publicznymi chmurami, szczególnie z Azure.
  • Nie tylko jesteś biegły w liderowaniu technicznie, ale także masz pasję do mentorowania i prowadzenia zespołów do doskonałości.
  • Cenisz i pielęgnujesz różnorodne, integracyjne miejsce pracy, które promuje otwartą rozmowę i kwestionuje konwencjonalne myślenie.
  • Wykazujesz inicjatywę, chęć do nauki nowych umiejętności i zaangażowanie w sukces zespołu.
  • Posiadasz wyjątkowe umiejętności komunikacyjne z zdolnością do przejrzystego i skutecznego dialogu.
  • Zrozumienie obciążeń pracy AI/ML to dodatkowy atut!

W OpenAI jesteśmy zaangażowani w rozwijanie technologii sztucznej inteligencji, która może głęboko wpłynąć na św