Tech Lead Manager (TLM) - Supercomputing Scalability

Job expired!

Про команду

Суперкомп’ютери є потужною силою, яка відкриває великі можливості в технологіях, і в OpenAI ми розширюємо можливості цих гігантів. Наш ключовий напрямок суперобчислень зосереджений на перевизначенні інфраструктури кластерних суперкомп’ютерів. Ми працюємо над підвищенням масштабованості понад існуючі кількості вузлів, оперативним розгортанням оновлень на рівні кластера, інтеграцією всеосяжного телеметрівня і впровадженням передового обладнання для підтримки світових зусиль в масштабуванні.

Про роль

Будучи Технічним Керівником (TLM) у Напрямку Масштабованості в OpenAI у жвавому Сан-Франциско, Каліфорнія, ви очолюватимете зусилля з оптимізації та розширення можливостей суперкомп’ютерів масштабу DC. Під вашим керівництвом наша команда буде використовувати і перевищувати межі широко доступних інструментів, вирішувати нові апаратні проблеми, і управляти ростом кластерів та баз користувачів суперкомп’ютерів. Це гнучка роль, яка вимагає трьох днів спільної роботи на місці щотижня, з доступною допомогою при переїзді для успішних кандидатів.

  • Пряме управління індивідуальними учасниками (IC), які закладають основу нашої масштабованості суперкомп’ютерів.
  • Сприяння високопродуктивному, гнучкому середовищу команди для глобального просування нашої технології суперобчислень, в той же час надаючи пріоритет безпеці та надійності.
  • Покращення оркестрації та моніторингових фреймворків для вищої продуктивності суперкомп’ютерів.
  • Просування автоматизації для забезпечення безпрецедентного контролю над нашим технологічним стеком.
  • Поглиблення нашого розуміння здоров’я та користі суперкомп’ютерів для проривних досліджень і тренування моделей.

Вам підходить ця роль