Machine Learning Research Engineer

Job expired!

O Neural Magic

Z siedzibą w Somerville, Massachusetts, Neural Magic jest startupem serii A wspieranym przez inwestorów najwyższej klasy, takich jak Andreessen Horowitz, NEA, Pillar, VMware, Verizon Ventures, Comcast Ventures i Amdocs. W Neural Magic pasjonuje nas udostępnianie AI. Naszą misją jest umożliwienie przedsiębiorstwom na całym świecie korzystania z otwartych LLM i VLLM, przyspieszanie adopcji AI i upraszczanie wdrażania GenAI. Jako kluczowy współtwórca projektu vLLM i pionierzy w kwantyzacji i przerzedzaniu modeli, Neural Magic oferuje solidną platformę dla przedsiębiorstw do budowania, optymalizacji i skalowania wdrożeń LLM.

Nasza misja

Naszą misją jest demokratyzacja mocy otwartych LLM i vLLM oraz udostępnienie ich każdemu przedsiębiorstwu na świecie.

Twoja rola

Jako Inżynier Badań nad Uczeniem Maszynowym w Neural Magic, będziesz napędzać innowacje, współpracując z naszym zespołem nad rozwiązaniem najważniejszych wyzwań związanych z wydajnością i efektywnością modeli. Twoja praca będzie miała znaczący wpływ na rozwój naszej zaawansowanej platformy software'owej, kształtując przyszłość wdrażania i korzystania z AI.

Bądź częścią naszej ekscytującej podróży w przekształcaniu krajobrazu AI!

  • Badania i Innowacje: Prowadź rozwój przełomowych projektów badawczych skoncentrowanych na poprawie wydajności, efektywności i skalowalności LLM.
  • Prototypowanie i Eksperymentowanie: Projektuj i wdrażaj prototypy do testowania nowych algorytmów i technik, stale przekraczając granice optymalizacji modeli i serwowania inferencji.
  • Analiza i Ocena: Przeprowadzaj kompleksowe eksperymenty i analizy, dokumentując wyniki i dzieląc się spostrzeżeniami z zespołem.
  • Współpraca i Komunikacja: Ściśle współpracuj z zespołami produktowymi i inżynierskimi, przekształcając prototypy badawcze w funkcje gotowe do produkcji, zapewniając ich płynną integrację z naszą platformą.
  • Wkład i Dzielenie się: Bądź na bieżąco z najnowszymi osiągnięciami w dziedzinie, przyczyniaj się do projektów open-source i rozpowszechniaj swoje wyniki poprzez publikacje i prezentacje.

Wymagania

  • Doświadczenie w Badaniach: Udokumentowane doświadczenie w prowadzeniu samodzielnych badań lub uczestniczeniu w projektach badawczych, zwłaszcza w dziedzinie LLM lub generatywnego AI.
  • Proficjencja Techniczna: Biegłość w programowaniu w Pythonie z głębokim zrozumieniem frameworków do głębokiego uczenia, takich jak PyTorch.
  • Doświadczenie w Optymalizacji: Znajomość technik optymalizacji modeli, takich jak przerzedzanie, kwantyzacja, destylacja lub inne metody zwiększające wydajność.
  • Umiejętności Rozwiązywania Problemów: Silna zdolność do identyfikowania i rozwiązywania złożonych wyzwań technicznych, stosując wiedzę teoretyczną w praktycznych zastosowaniach.
  • Umiejętności Komunikacyjne: Doskonałe umiejętności pisemne i werbalne w celu efektywnego przekazywania wyników badań i współpracy z zespo