HPC Engineer, Machine Learning Infrastructure - EMEA Remote

Job expired!

Ласкаво просимо до Hugging Face! Ми прагнемо просувати машинне навчання та робити його більш доступним для всіх. Наша подорож включає внесок у розвиток технологій заради кращого майбутнього.

Ми створили найшвидше зростаючу, відкриту бібліотеку попередньо навчених моделей у світі. Hugging Face технологію використовують у виробництві понад 15 000 компаній, включаючи провідні організації у сфері штучного інтелекту, такі як Google, Elastic, Salesforce, Grammarly та NASA, маючи понад 1 мільйон моделей та 320 тисяч зірок на GitHub.

Ми шукаємо досвідченого інженера HPC для розробки та масштабування нашого розподіленого великого кластеру. Ідеальний кандидат матиме міцний досвід у налаштуванні великих комп'ютерних кластерів для AI-робочих навантажень та керуванні командами для створення найкращих практик щодо надійності та масштабованості.

  • Проектувати, розробляти, розгортувати і підтримувати надійну та масштабовану інфраструктуру для ефективних тренувальних робочих навантажень.
  • Керувати великими обчислювальними кластерами для AI-тренування та розробки.
  • Створювати інструменти та інфраструктуру для абстрагування обчислювальних і зберігаючих ресурсів у ML-робочих процесах.
  • Вимірювати та оптимізовувати продуктивність системи.
  • Моніторити та усувати проблеми інфраструктури для забезпечення високої доступності та продуктивності AI-робочих навантажень.
  • Бути в курсі найновіших технологій AI-інфраструктури та рекомендувати покращення.
  • Співпрацювати з командами розробників ПЗ для AI, щоб забезпечити інфраструктурну підтримку системних вимог.
  • Забезпечувати основну операційну підтримку та інженерну діяльність для кількох команд.
  • 7+ років досвіду на посаді інженера DevOps або інфраструктури, з акцентом на машинне навчання та великі кластери GPU.
  • Експертні знання з роботи з хмарними провайдерами, такими як AWS, GCP, фреймворками для інфраструктури як коду та інструментами спостереження.
  • Досвід роботи з науковою стекою Python та Pytorch.
  • Досвід роботи з структурами даних, моделюванням даних та управлінням базами даних, включно з об'єктними і файловими системами зберігання.
  • Сильні комунікативні, співпрацяні та документувальні навички.
  • Знайомство з Linux, Git, контейнерами, мережами та інструментами командного рядка.
  • Сильні навички програмування на Python, Golang та/або Rust.

Якщо ви захоплений інженер HPC з глибоким інтересом до AI і процвітаєте у складному, інноваційному середовищі, ми хочемо вас почути. Приєднуйтесь до нашої команди, щоб допомагати просуванню AI-технологій, працюючи поруч із талановитими професіоналами в співпраці та стимулюючому середовищі.

Ми прагнемо створити різноманітне та інклюзивне робоче місце. Hugging Face є роботодавцем з рівними можливостями і святкує різноманітність. Ми не дискримінуємо за ознакою раси, релігії, кольору шкіри, національного походження, статі, сексуальної ор