Member of Technical Staff: Research Engineer, Post-Training

Job expired!

W Essential AI mamy fascynującą misję polegającą na zwiększaniu synergii między ludźmi a komputerami, znacznie rozszerzając możliwości współpracy poza obecne ograniczenia. Nasz cel jest jasny: tworzyć wyjątkowe wrażenia użytkownika, będąc na czele innowacji - od interfejsu użytkownika po najbardziej wydajne modele obliczeniowe. Wspierani przez wiodących inwestorów takich jak March Capital, Thrive Capital, AMD, Franklin Venture Partners, Google, KB Investment i NVIDIA, budujemy zespół dynamiczny i zwięzły, gotowy do osiągnięcia przełomowych postępów w dziedzinie AI.

Jako kluczowy członek naszego zespołu technicznego, Twoją główną odpowiedzialnością będzie rozwijanie i wdrażanie strategii optymalizacji i doskonalenia modeli AI po początkowym treningu. Obejmuje to poprawę wydajności, solidności i efektywności modeli. Współpraca między zespołami będzie kluczowa, aby zidentyfikować możliwości do ulepszeń po treningu oraz ocenić ich wpływ na funkcjonalność modelu.

  • Przewodzić i znacznie przyczyniać się do inicjatyw badawczych, które poprawiają rzeczywiste zastosowania naszych modeli AI.
  • Blisko współpracować z zespołami produktowymi, łącząc badania i rozwój produktu, identyfikując luki i oceniając ulepszenia.
  • Rozwijać innowacyjne techniki post-treningowe w celu zaawansowania optymalizacji modeli uczenia maszynowego.
  • Przeprowadzać benchmarking i oceny różnych strategii post-treningowych w różnych zestawach danych i architekturach modeli.
  • Analizować wyniki w celu odkrycia wglądów w zachowania modeli i identyfikacji możliwości ulepszeń.
  • Wdrażać modele i algorytmy dla faz post-treningowych, optymalizując pod kątem wydajności i skalowalności w środowiskach produkcyjnych.
  • Angażować się z naukowcami i inżynierami badawczymi w celu odkrycia dalszych obszarów do ulepszeń post-treningowych.
  • Udowodnione doświadczenie badawcze skoncentrowane na post-treningu i optymalizacji dużych modeli językowych, ze znajomością frameworków takich jak Megatron, DeepSpeed, MaxText itp.
  • Trwałe podstawy w zasadach uczenia maszynowego kierujących innowacyjnymi podejściami badawczymi.
  • Doświadczenie w opracowywaniu lub ulepszaniu metod w ML lub pokrewnych dziedzinach.
  • Doświadczenie w zadaniach inżynierii danych, takich jak optymalizacja procesów przetwarzania danych, inżynieria cech i ocena modeli.
  • Silne umiejętności programistyczne w językach Python, C++ lub Java, oraz znajomość wdrażania ML i orkiestracji.
  • Znakomite zdolności rozwiązywania problemów, analityczne i komunikacyjne, zdolne do obsługi złożonych analiz danych i wyciągania praktycznych wniosków.
  • Pasjonat budowania innowacyjnych rozwiązań w współpracującym, dynamicznym środowisku.

Zlokalizow