Dołącz do globalnego lidera transformacji cyfrowej! W CI&T współpracujemy z najbardziej cenionymi markami na świecie, tworząc innowacyjne rozwiązania cyfrowe, które rewolucjonizują biznes. Nasz 29-letni dorobek w kreowaniu wpływu na biznes oraz zespół ponad 6000 profesjonalistów na całym świecie specjalizuje się w strategii, badaniach, data science, projektowaniu i inżynierii, aby wspierać rozwój, poprawiać doświadczenie klientów oraz optymalizować efektywność operacyjną.
CI&T poszukuje doświadczonych Data Scientistów z wiedzą w zakresie Przetwarzania Języka Naturalnego (NLP), aby prowadzić inicjatywy AI w amerykańskim przemyśle zdrowotnym. Jako kluczowy gracz, będziesz napędzał wpływ biznesowy, wykorzystując najnowocześniejsze rozwiązania AI.
Obowiązki:
- Prowadzenie eksploracji danych w celu weryfikacji wymagań i jakości danych w kontekście NLP.
- Wykonywanie preprocessing NLP, w tym Tokenizacja, Analiza Leksalna, Analiza Składniowa, Analiza Semantyczna oraz Analiza Pragmatyczna.
- Określanie i dopasowywanie najlepszych modeli NLP do oczekiwanych wyników biznesowych.
- Szkolenie i walidacja modeli przy użyciu miar takich jak dokładność, precyzja, recall, F1-score i ROUGE score.
- Dokumentowanie procesów rozwoju modeli, metodologii i wyników dla wszystkich interesariuszy.
- Wdrażanie klasyfikacji tekstu i analizę sentymentu przy użyciu tradycyjnych klasyfikatorów maszynowego uczenia i modeli głębokiego uczenia.
- Poprawianie wydajności modeli NLP poprzez rygorystyczne eksperymenty i analizy.
- Stosowanie technik modelowania tematów, takich jak LDA i NMF, w celu odkrywania abstrakcyjnych tematów z danych tekstowych.
- Zrozumienie i zastosowanie modeli sekwencja-sekwencja do zadań związanych z tłumaczeniem maszynowym, streszczeniem tekstu i odpowiedziami na pytania.
Wymagania:
- Biegłość w komunikacji ustnej i pisemnej w języku angielskim.
- Doświadczenie w międzynarodowych projektach i jako Data Scientist w projektach NLP.
- Zarządzanie Pythonem, szczególnie w zakresie pakietów takich jak NLTK, spaCy i Gensim.
- Doświadczenie w technikach takich jak Ekstrakcja Tematów, Streszczanie, Kategoryzacja i Analiza Sentymentu.
- Silne umiejętności rozwiązywania problemów i kreatywność w stosowaniu technik NLP do rzeczywistych wyzwań.
- Świadomość etycznych aspektów NLP, w tym uprzedzeń, prywatności i wpływu na społeczeństwo.
- Biegłość w całym cyklu data science, od gromadzenia danych do wdrażania.
- Ekspertyza w obsłudze, analizowaniu i wizualizowaniu dużych zbiorów danych przy użyciu narzędzi takich jak SQL i Python.
Preferowane umiejętności:
- Doświadczenie z Augmentacją Danych.
- Znajomość Transformatorów, BERT i Named Entity Recognition (NER).
- Tło w inżynierii danych.
- Doświadczenie z MLOps i usługami Azure.
- Biegłość w Databricks.
- Znajomość przepisów dotyczących ochrony danych, takich jak PII, CCPA i HIPAA.
Nasze świadczenia: