Senior AI and ML Infra Engineer, Research Clusters

Job expired!

Ви захоплюєтесь штучним інтелектом та машинним навчанням? NVIDIA у Санта-Кларі, Каліфорнія, США шукає кваліфікованого інженера інфраструктури AI/ML, щоб покращити наші передові технологічні рішення. Це неперевершена можливість зробити внесок у команду, яка є на передовій технологій AI/ML, просуваючи інновації, що впливають на світ.

Як Старший інженер інфраструктури AI та ML, ваше основне завдання буде підвищувати продуктивність наших дослідницьких команд, виявляючи та усуваючи прогалини в інфраструктурі. Це включає розробку та впровадження рішень для покращення масштабованості, надійності та ефективності наших великих кластерів GPU та інших критичних систем.

  • Розуміння потреб інфраструктури дослідницьких команд з AI/ML і переклад цих потреб у ефективні покращення.
  • Розробка рішень для управління сховищем, атрибуції помилок та надійності в рамках наших кластерів GPU.
  • Оптимізація продуктивності та використання ресурсів інфраструктури AI/ML через постійний моніторинг та модернізацію.
  • Розробка інструментів автоматизації та стратегій операційної діяльності для мінімізації ручних завдань та спрощення управління інфраструктурою.
  • Співпраця з командами різних напрямків для забезпечення безперервної та надійної екосистеми інфраструктури AI/ML.
  • Оновлення інформації про останні досягнення в технологіях AI/ML та їх інтеграція в стратегії NVIDIA.

Ми шукаємо когось із ступенем бакалавра або еквівалентом (магістратура бажана) у галузі комп'ютерних наук або суміжних напрямках, підкріпленого принаймні 12-річним відповідним досвідом. Ви повинні мати сильний досвід у програмуванні з глибоким розумінням високомасштабованих розподілених систем, бажано в інфраструкту