Inżynier Danych - Badania

  • Full Time
Job expired!

O firmie Stability:

Stability AI to prowadzona przez społeczność i z myślą o misji firma specjalizująca się w technologiach otwartoźródłowej sztucznej inteligencji, której głęboko zależy na rzeczywistych implikacjach i zastosowaniach. Nasze najważniejsze postępy wynikają z różnorodności zespołu, złożonego z różnych grup i dyscyplin. Nie boimy się kwestionować ustalonych norm i pielęgnować innowacji. Nasze dynamiczne społeczności składają się ze specjalistów, liderów i partnerów na całym świecie, którzy tworzą zaawansowane otwarte modele AI dla obrazu, języka, dźwięku, wideo, 3D i biologii.

O roli:

Szukamy utalentowanego Inżyniera Danych, specjalizującego się w skutecznym skalowaniu rozproszonych obciążeń. Będziesz pracować we współpracy z rozkwitającym wielodyscyplinarnym zespołem doświadczonych naukowców i inżynierów machine learning, aby zwiększyć wydajność naszych modeli. W tej roli przyczynisz się do rewolucyjnych projektów, takich jak szkolenie największych otwartych modeli językowych i będziesz odpowiedzialny za zapewnienie, że dane są odpowiednio zbierane, przetwarzane i wykorzystywane.

Obowiązki:

  • Oczyszczanie, standaryzowanie i przetwarzanie danych w sposób skalowalny i możliwy do zrównoleglenia, aby przygotować je do wprowadzenia do naszych potoków szkolenia modelu machine learning, gwarantując wysoką jakość danych.
  • Budowanie i utrzymanie wysoce skalowalnych rozproszonych obciążeń.
  • Konstruowanie potoków danych do wprowadzania i przetwarzania danych (np. obrazów i tekstu) w celu integracji z modelami ML.
  • Zarządzanie zasobami AWS.
  • Utrzymywanie aktualności metod poprawy jakości danych i/lub kurateli danych dla obrazów, filmów, LLM itp.

Kwalifikacje:

  • Udowodnione doświadczenie w dużych, rozproszonych obciążeniach.
  • Doświadczenie z dużymi obciążeniami danych do szkoleń machine learning.
  • Doświadczenie z przechowywaniem w chmurze i systemami plików. AWS (S3) jest mocno preferowany, ale otwarty na inne platformy cloud.
  • Doświadczenie z Python + Pytorch.
  • Doświadczenie z wieloprocesowym i wielowątkowym przetwarzaniem obciążeń w Pythonie.
  • Świetne umiejętności komunikacyjne do efektywnej współpracy z użytkownikami, rozwiązywania problemów i udzielania porad.
  • Skrupulatna uwaga na szczegóły i umiejętność efektywnej dokumentacji procesów i rozwiązań.
  • Mocne zainteresowanie generatywnym AI.
  • Doświadczenie z projektami Machine Learning, a idealnie także wiedza na temat głębokiego uczenia / wizji komputerowej.
  • Doświadczenie ze stosami ładowania danych (webdataset, torchdata, fsspec, AIstore) i równoległym manipulowaniem ramkami danych za pomocą Pyspark/Ray jest dodatkowym atutem.

Równe szanse na zatrudnienie:

Jesteśmy pracodawcą zapewniającym równe szanse na zatrudnienie i nie dyskryminujemy ze względu na rasę, religię, pochodzenie narodowe, płeć, orientację seksualną, wiek, status weterana, niepełnosprawność lub inne prawnie chronione statusy.