Polish
- English
- Spanish
- French
- Ukrainian
- Russian
- Japanese
- Egyptian

Machine Learning Engineer - Inference (Accelerated AI)

Job expired!

Together AI aktywnie poszukuje utalentowanego Inżyniera Uczenia Maszynowego do dołączenia do naszego dynamicznego Zespołu Silników Inference. Ta kluczowa rola koncentruje się na optymalizacji i poprawie wydajności naszych systemów inference AI, wykorzystując najnowsze modele językowe, aby zapewnić efektywność i skalowalność.

Jeśli pasjonujesz się inference AI, znasz się na PyTorch i masz umiejętności w tworzeniu systemów o wysokiej wydajności, chcemy Cię poznać. Ta pozycja oferuje wyjątkową okazję do współpracy z wiodącymi badaczami i inżynierami AI w tworzeniu najnowocześniejszych rozwiązań AI. Przyjdź kształtować przyszłość AI z Together AI!

Projektowanie i rozwijanie zaawansowanych systemów produkcyjnych, które napędzają silnik inference Together AI, zapewniając niezawodność i wydajność na dużą skalę.
Optymalizacja usług runtime inference dla rozległych aplikacji AI.
Współpraca z badaczami, inżynierami, menedżerami produktu i projektantami w celu wprowadzania nowych funkcji i możliwości badawczych.
Prowadzenie dokładnych przeglądów projektowych i kodowych w celu utrzymania najwyższych standardów jakości.
Tworzenie usług, narzędzi i kompleksowej dokumentacji dla deweloperów wspierających silnik inference.
Implementacja solidnych i odpornych systemów do zamieszczania i przetwarzania danych.

Minimum 3-letnie doświadczenie w pisaniu wysokowydajnego, dobrze przetestowanego kodu produkcyjnej jakości.
Biegłość w Python i PyTorch.
Udokumentowane doświadczenie w tworzeniu wysokowydajnych bibliotek i narzędzi.
Wyjątkowe zrozumienie niskopoziomowych koncepcji systemów operacyjnych, w tym wielowątkowości, zarządzania pamięcią, sieci, przechowywania danych, wydajności i skalowalności.

Znajomość istniejących systemów inference AI, takich jak TGI, vLLM, TensorRT-LLM, Optimum.
Znajomość technik inference AI, takich jak dekodowanie spekulatywne.
Doświadczenie w programowaniu z użyciem CUDA/Triton.
Mile widziane: Znajomość Rust, Cython i kompilatorów.

Together AI to nowatorska firma zajmująca się sztuczną inteligencją, napędzana badaniami. Jesteśmy zobowiązani do otwartych i przejrzystych systemów AI, które napędzają innowacje i przynoszą najlepsze rezultaty dla społeczeństwa. Naszą misją jest znaczne obniżenie kosztów nowoczesnych systemów AI poprzez współprojektowanie oprogramowania, sprzętu, algorytmów i modeli.

Wnieśliśmy wkład w wiodące badania open-source, modele i zestawy danych, aby poszerzyć granice AI. Nasz zespół odegrał kluczową rolę w przełomach technologicznych, takich jak FlashAttention, Hyena, FlexGen i RedPajama. Dołącz do naszej pasjonującej grupy naukowców i inżynierów w naszej drodze do budowy infrastruktury AI nowej generacji.

Oferujemy konkurencyjny pakiet wynagrodzeń, w tym udziały w startupie, ubezpieczenie zdrowotne i inne imponujące korzyści. Podstawowy zakres wynagrodzenia w USA dla tego pełnoetatowego stanowiska wynosi od 160,000 do 220,000 USD, plus udziały i korzyści. Nasze zakresy wynagrodzeń są ustalane na podstawie lokalizacji, poziomu i roli, z indywidualnym wynagrod