Tech Lead Manager (TLM) - Supercomputing Scheduling

Other
San Francisco
06/12/2024
-

Job expired!

O zespole: Filaram Planowania Superkomputerów w OpenAI skupia się na niezawodności, skalowalności i przyjazności dla użytkownika w zarządzaniu cyklem życia zadań. Jesteśmy dumni, że oferujemy efektywne i elastyczne planowanie zadań, zarządzanie limitami oraz uproszczone przepływy pracy związane z wykonaniem zadań. Naszym celem jest zwiększenie produktywności badaczy poprzez zapewnienie wysokiej przepustowości, efektywnego pakowania oraz spójnego, ergonomicznego przepływu pracy podczas szkolenia, skalując do większych superkomputerów przy minimalnym obciążeniu operacyjnym.

O roli: Jako Tech Lead Manager (TLM) / Kierownik Inżynierii w naszym Filarze Planowania będziesz prowadził dynamiczny zespół, który projektuje, wdraża i zarządza systemami zarządzania cyklem życia zadań do trenowania modeli na niektórych z największych superkomputerów świata. Ta rola oferuje ogromną skalę, napięte terminy oraz szansę na znaczący wpływ na misję OpenAI. Kluczowe jest głębokie zrozumienie techniczne, chociaż niekoniecznie w ML/DL.

To stanowisko jest zlokalizowane w San Francisco, CA i opiera się na modelu pracy hybrydowej z trzema dniami w biurze tygodniowo. Pomoc w relokacji jest dostępna dla kwalifikowanych kandydatów.

Bezpośrednie zarządzanie Pracownikami Indywidualnymi (ICs) rozwijającymi naszą technologię planowania superkomputerowego.
Budowanie i prowadzenie wydajnych zespołów w celu bezpiecznego i niezawodnego dostarczania naszej technologii użytkownikom na całym świecie.
Projektowanie, implementacja i zarządzanie kluczowymi komponentami naszego systemu planowania zadań, zarządzania limitami i systemów kolejkowania.
Ścisła współpraca z badaczami w celu dostosowania zasobów superkomputerowych do wymagań projektowych.
Integracja funkcji cyklu życia zadań z infrastrukturą klastrową, rozwiązaniami do przechowywania danych oraz protokołami zdrowia sprzętu.

Mogą Państwo być idealnym kandydatem, jeżeli:

Posiadają Państwo szerokie doświadczenie w systemach planowania hyperskalowych.
Posiadają Państwo mocne umiejętności programistyczne i silne osiągnięcia w środowiskach chmurowych, szczególnie w Azure.
Jesteście Państwo zmotywowani, z ostrym skupieniem na wykonaniu i potrzebach użytkowników.
Możecie efektywnie prowadzić zespoły techniczne, promując różnorodne, sprawiedliwe i inkluzjywne kultury miejsca pracy.
Jesteście Państwo proaktywni w rozwiązywaniu problemów i chętni do zdobywania nowej wiedzy, gdy jest to potrzebne.
Wyróżniają Państwo się w komunikacji, mając talent do jasnego wyrażania się i uważnego słuchania.

Doświadczenie w pracy z obciążeniami AI/ML jest atutem, ale nie jest wymagane.

OpenAI jest zaanga