[Job- 15824] Senior Data Scientist - NLP

Job expired!

Dołącz do globalnego lidera transformacji cyfrowej! W CI&T współpracujemy z najbardziej cenionymi markami na świecie, tworząc innowacyjne rozwiązania cyfrowe, które rewolucjonizują biznes. Nasz 29-letni dorobek w kreowaniu wpływu na biznes oraz zespół ponad 6000 profesjonalistów na całym świecie specjalizuje się w strategii, badaniach, data science, projektowaniu i inżynierii, aby wspierać rozwój, poprawiać doświadczenie klientów oraz optymalizować efektywność operacyjną.

CI&T poszukuje doświadczonych Data Scientistów z wiedzą w zakresie Przetwarzania Języka Naturalnego (NLP), aby prowadzić inicjatywy AI w amerykańskim przemyśle zdrowotnym. Jako kluczowy gracz, będziesz napędzał wpływ biznesowy, wykorzystując najnowocześniejsze rozwiązania AI.

Obowiązki:

  • Prowadzenie eksploracji danych w celu weryfikacji wymagań i jakości danych w kontekście NLP.
  • Wykonywanie preprocessing NLP, w tym Tokenizacja, Analiza Leksalna, Analiza Składniowa, Analiza Semantyczna oraz Analiza Pragmatyczna.
  • Określanie i dopasowywanie najlepszych modeli NLP do oczekiwanych wyników biznesowych.
  • Szkolenie i walidacja modeli przy użyciu miar takich jak dokładność, precyzja, recall, F1-score i ROUGE score.
  • Dokumentowanie procesów rozwoju modeli, metodologii i wyników dla wszystkich interesariuszy.
  • Wdrażanie klasyfikacji tekstu i analizę sentymentu przy użyciu tradycyjnych klasyfikatorów maszynowego uczenia i modeli głębokiego uczenia.
  • Poprawianie wydajności modeli NLP poprzez rygorystyczne eksperymenty i analizy.
  • Stosowanie technik modelowania tematów, takich jak LDA i NMF, w celu odkrywania abstrakcyjnych tematów z danych tekstowych.
  • Zrozumienie i zastosowanie modeli sekwencja-sekwencja do zadań związanych z tłumaczeniem maszynowym, streszczeniem tekstu i odpowiedziami na pytania.

Wymagania:

  • Biegłość w komunikacji ustnej i pisemnej w języku angielskim.
  • Doświadczenie w międzynarodowych projektach i jako Data Scientist w projektach NLP.
  • Zarządzanie Pythonem, szczególnie w zakresie pakietów takich jak NLTK, spaCy i Gensim.
  • Doświadczenie w technikach takich jak Ekstrakcja Tematów, Streszczanie, Kategoryzacja i Analiza Sentymentu.
  • Silne umiejętności rozwiązywania problemów i kreatywność w stosowaniu technik NLP do rzeczywistych wyzwań.
  • Świadomość etycznych aspektów NLP, w tym uprzedzeń, prywatności i wpływu na społeczeństwo.
  • Biegłość w całym cyklu data science, od gromadzenia danych do wdrażania.
  • Ekspertyza w obsłudze, analizowaniu i wizualizowaniu dużych zbiorów danych przy użyciu narzędzi takich jak SQL i Python.

Preferowane umiejętności:

  • Doświadczenie z Augmentacją Danych.
  • Znajomość Transformatorów, BERT i Named Entity Recognition (NER).
  • Tło w inżynierii danych.
  • Doświadczenie z MLOps i usługami Azure.
  • Biegłość w Databricks.
  • Znajomość przepisów dotyczących ochrony danych, takich jak PII, CCPA i HIPAA.

Nasze świadczenia:

  • Plany