Data Trainer - Machine Learning & NLP

Job expired!

MindTech, pionier w dostarczaniu kompleksowych rozwiązań w zakresie bezpieczeństwa danych i zgodności, poszukuje doświadczonego Szkoleniowca Danych / Data Scientist specjalizującego się w uczeniu maszynowym i przetwarzaniu języka naturalnego. Nasz idealny kandydat czuje się jak ryba w wodzie w zaawansowanym technologicznie środowisku, kształtując wysokiej jakości zestawy danych, aby poprawić rozwiązania oparte na danych we wszelkich obszarach biznesowych.

Szkoleniowiec Danych / Data Scientist będzie odgrywał kluczową rolę w generowaniu i zarządzaniu solidnymi zestawami danych wykorzystywanymi przez programistów AI/software, zespoły QA oraz inżynierów terenowych. Stanowisko to skupia się głównie na tworzeniu i utrzymywaniu zestawów danych zawierających dane osobowe, kluczowe do szkolenia modeli AI i umożliwienia testowania QA. Mimo że głównym celem nie jest rozwijanie nowych modeli, umiejętności modelowania będą uznane za cenną wartość dodaną.

Szukamy starszego członka zespołu, który może działać niezależnie i wprowadzać kreatywność do naszych operacji, zwiększając nasze oferty biznesowe i rozwiązania danych.

  • Rozwój reprezentatywnych zestawów danych, które naśladują dane klientów dla modułów szkoleniowych, wspomagając zespoły QA i developerskie.
  • Ekstrakcja wrażliwych danych dopasowanych do konkretnych produktów i wymagań klientów.
  • Udowodnione doświadczenie w rozwijaniu skomplikowanych pipeline'ów ETL, szczególnie tych obsługujących tekst i wzorce językowe.
  • Ekspertyza w Pythonie oraz narzędziach takich jak pandas, numpy, Gensim, spaCy, NLTK; biegłość w obsłudze baz danych SQL i NoSQL.
  • Wykazanie się starannością w jakości danych i głębokim zrozumieniem różnorodnych potrzeb biznesowych.
  • Umiejętność pisania modułowego kodu oraz udział w środowiskach współpracy, w tym w przeglądach kodu.
  • Doświadczenie we współpracy z programistami, menedżerami produktu i innymi interesariuszami w celu integracji rozwiązań danych i doskonalenia wymagań biznesowych.
  • Mocne umiejętności komunikacyjne ze zdolnością do jasnej i zorganizowanej dokumentacji oprogramowania i danych.
  • Doświadczenie w pracy z analizą tekstu i modelami uczenia maszynowego skupionymi na klasyfikacji tekstu i wykrywaniu bytów.
  • Zainteresowanie lub doświadczenie w web scrapingu, automatycznej kreacji treści, cyklach życia ML lub AI, pipeline'ach CI/CD oraz MLOps.
  • Ciekawość i chęć ciągłego informowania się o najnowszych trendach w dziedzinie uczenia maszynowego i sztucznej inteligencji.
  • Doświadczenie z wykorzystaniem Dużych Modeli Językowych (LLM) w realnych scenariuszach biznesowych, szczególnie w tworzeniu treści lub danych.
  • Znajomość platform ob