W Essential AI mamy fascynującą misję polegającą na zwiększaniu synergii między ludźmi a komputerami, znacznie rozszerzając możliwości współpracy poza obecne ograniczenia. Nasz cel jest jasny: tworzyć wyjątkowe wrażenia użytkownika, będąc na czele innowacji - od interfejsu użytkownika po najbardziej wydajne modele obliczeniowe. Wspierani przez wiodących inwestorów takich jak March Capital, Thrive Capital, AMD, Franklin Venture Partners, Google, KB Investment i NVIDIA, budujemy zespół dynamiczny i zwięzły, gotowy do osiągnięcia przełomowych postępów w dziedzinie AI.
Jako kluczowy członek naszego zespołu technicznego, Twoją główną odpowiedzialnością będzie rozwijanie i wdrażanie strategii optymalizacji i doskonalenia modeli AI po początkowym treningu. Obejmuje to poprawę wydajności, solidności i efektywności modeli. Współpraca między zespołami będzie kluczowa, aby zidentyfikować możliwości do ulepszeń po treningu oraz ocenić ich wpływ na funkcjonalność modelu.
- Przewodzić i znacznie przyczyniać się do inicjatyw badawczych, które poprawiają rzeczywiste zastosowania naszych modeli AI.
- Blisko współpracować z zespołami produktowymi, łącząc badania i rozwój produktu, identyfikując luki i oceniając ulepszenia.
- Rozwijać innowacyjne techniki post-treningowe w celu zaawansowania optymalizacji modeli uczenia maszynowego.
- Przeprowadzać benchmarking i oceny różnych strategii post-treningowych w różnych zestawach danych i architekturach modeli.
- Analizować wyniki w celu odkrycia wglądów w zachowania modeli i identyfikacji możliwości ulepszeń.
- Wdrażać modele i algorytmy dla faz post-treningowych, optymalizując pod kątem wydajności i skalowalności w środowiskach produkcyjnych.
- Angażować się z naukowcami i inżynierami badawczymi w celu odkrycia dalszych obszarów do ulepszeń post-treningowych.
- Udowodnione doświadczenie badawcze skoncentrowane na post-treningu i optymalizacji dużych modeli językowych, ze znajomością frameworków takich jak Megatron, DeepSpeed, MaxText itp.
- Trwałe podstawy w zasadach uczenia maszynowego kierujących innowacyjnymi podejściami badawczymi.
- Doświadczenie w opracowywaniu lub ulepszaniu metod w ML lub pokrewnych dziedzinach.
- Doświadczenie w zadaniach inżynierii danych, takich jak optymalizacja procesów przetwarzania danych, inżynieria cech i ocena modeli.
- Silne umiejętności programistyczne w językach Python, C++ lub Java, oraz znajomość wdrażania ML i orkiestracji.
- Znakomite zdolności rozwiązywania problemów, analityczne i komunikacyjne, zdolne do obsługi złożonych analiz danych i wyciągania praktycznych wniosków.
- Pasjonat budowania innowacyjnych rozwiązań w współpracującym, dynamicznym środowisku.
Zlokalizow