Member of Technical Staff: Research Engineer, Post-Training

Other
San Francisco
06/12/2024
-

Job expired!

W Essential AI mamy fascynującą misję polegającą na zwiększaniu synergii między ludźmi a komputerami, znacznie rozszerzając możliwości współpracy poza obecne ograniczenia. Nasz cel jest jasny: tworzyć wyjątkowe wrażenia użytkownika, będąc na czele innowacji - od interfejsu użytkownika po najbardziej wydajne modele obliczeniowe. Wspierani przez wiodących inwestorów takich jak March Capital, Thrive Capital, AMD, Franklin Venture Partners, Google, KB Investment i NVIDIA, budujemy zespół dynamiczny i zwięzły, gotowy do osiągnięcia przełomowych postępów w dziedzinie AI.

Jako kluczowy członek naszego zespołu technicznego, Twoją główną odpowiedzialnością będzie rozwijanie i wdrażanie strategii optymalizacji i doskonalenia modeli AI po początkowym treningu. Obejmuje to poprawę wydajności, solidności i efektywności modeli. Współpraca między zespołami będzie kluczowa, aby zidentyfikować możliwości do ulepszeń po treningu oraz ocenić ich wpływ na funkcjonalność modelu.

Przewodzić i znacznie przyczyniać się do inicjatyw badawczych, które poprawiają rzeczywiste zastosowania naszych modeli AI.
Blisko współpracować z zespołami produktowymi, łącząc badania i rozwój produktu, identyfikując luki i oceniając ulepszenia.
Rozwijać innowacyjne techniki post-treningowe w celu zaawansowania optymalizacji modeli uczenia maszynowego.
Przeprowadzać benchmarking i oceny różnych strategii post-treningowych w różnych zestawach danych i architekturach modeli.
Analizować wyniki w celu odkrycia wglądów w zachowania modeli i identyfikacji możliwości ulepszeń.
Wdrażać modele i algorytmy dla faz post-treningowych, optymalizując pod kątem wydajności i skalowalności w środowiskach produkcyjnych.
Angażować się z naukowcami i inżynierami badawczymi w celu odkrycia dalszych obszarów do ulepszeń post-treningowych.

Udowodnione doświadczenie badawcze skoncentrowane na post-treningu i optymalizacji dużych modeli językowych, ze znajomością frameworków takich jak Megatron, DeepSpeed, MaxText itp.
Trwałe podstawy w zasadach uczenia maszynowego kierujących innowacyjnymi podejściami badawczymi.
Doświadczenie w opracowywaniu lub ulepszaniu metod w ML lub pokrewnych dziedzinach.
Doświadczenie w zadaniach inżynierii danych, takich jak optymalizacja procesów przetwarzania danych, inżynieria cech i ocena modeli.
Silne umiejętności programistyczne w językach Python, C++ lub Java, oraz znajomość wdrażania ML i orkiestracji.
Znakomite zdolności rozwiązywania problemów, analityczne i komunikacyjne, zdolne do obsługi złożonych analiz danych i wyciągania praktycznych wniosków.
Pasjonat budowania innowacyjnych rozwiązań w współpracującym, dynamicznym środowisku.

Zlokalizow