Dołącz do naszego zespołu jako Data Scientist - Modelowanie NLP w Ford Motor Company
O roli
Poszukujemy wysoce kwalifikowanego i zaangażowanego Naukowca Danych, który dołączy do naszego zespołu Analizy Jakości w ramach Globalnego Wydziału Wnioskowania i Analityki Danych (GDI&A) w Ford Motor Company. W tej kluczowej roli, skoncentrowanej na Modelowaniu Przetwarzania Języka Naturalnego (NLP), będziesz miał decydujący wpływ na tworzenie innowacyjnych rozwiązań, które wzmocnią funkcje analizy jakości naszej prestiżowej organizacji.
Kluczowe obowiązki
- Tworzenie i wdrażanie modeli NLP w celu wyciągania znaczących wniosków z ogromnej ilości nieustrukturyzowanych danych tekstowych.
- Współpraca z interdyscyplinarnymi zespołami w celu identyfikacji nowych możliwości i strategii stosowania metod NLP do poprawy analizy jakości.
- Tworzenie i stosowanie zaawansowanych technik przetwarzania wstępnego danych i inżynierii cech dla aplikacji NLP.
- Wykorzystywanie zarówno nadzorowanych, jak i nienadzorowanych technik uczenia maszynowego w rozwiązywaniu skomplikowanych wyzwań NLP.
- Ciągła ocena i doskonalenie modeli w celu poprawy wydajności, dokładności i efektywności.
- Dostarczanie wysokiej jakości, łatwego do utrzymania kodu do istniejących i nowych łańcuchów przetwarzania danych.
- Utrzymywanie aktualności z najnowszymi technologiami NLP i przyczynianie się do ciągłego udoskonalania naszych metodologii i algorytmów.
- Skuteczna komunikacja wszystkich wyników, wniosków i strategicznych zaleceń do interesariuszy w sposób jasny i wpływowy.
Minimalne wymagania
- Stopień magistra w dziedzinie informatyki, inżynierii, nauk o danych, statystyki, matematyki stosowanej lub pokrewnej dziedzinie.
- Co najmniej 2 lata praktycznego doświadczenia w programowaniu w Pythonie, skoncentrowane na analizie danych i uczeniu maszynowym.
- Minimum 1 rok pracy z językami programowania SQL i zarządzaniem relacyjnymi bazami danych.
- Ponad 2 lata doświadczenia w wykorzystywaniu głównych bibliotek i frameworków NLP, takich jak NLTK, spaCy i Gensim.
- Udowodnione umiejętności w zakresie zarówno nadzorowanych, jak i nienadzorowanych technik uczenia maszynowego.
Preferowane wymagania
- Doktorat w odpowiedniej dziedzinie, takiej jak informatyka, inżynieria lub nauki o danych.
- Doświadczenie z dużymi modelami językowymi, takimi jak GPT-4, Palm i Llama-2.
- Znajomość frameworków do uczenia głębokiego, w tym TensorFlow i PyTorch.
- Doświadczenie w branży związane z modelowaniem NLP, najlepiej w sektorze motoryzacyjnym lub podobnym.
- Znajomość korzystania z Git i GitHub do kontroli wersji