Data Trainer - Machine Learning & NLP

Job expired!

MindTech, pionier w dostarczaniu kompleksowych rozwiązań w zakresie bezpieczeństwa danych i zgodności, poszukuje doświadczonego Szkoleniowca Danych / Data Scientist specjalizującego się w uczeniu maszynowym i przetwarzaniu języka naturalnego. Nasz idealny kandydat czuje się jak ryba w wodzie w zaawansowanym technologicznie środowisku, kształtując wysokiej jakości zestawy danych, aby poprawić rozwiązania oparte na danych we wszelkich obszarach biznesowych.

Szkoleniowiec Danych / Data Scientist będzie odgrywał kluczową rolę w generowaniu i zarządzaniu solidnymi zestawami danych wykorzystywanymi przez programistów AI/software, zespoły QA oraz inżynierów terenowych. Stanowisko to skupia się głównie na tworzeniu i utrzymywaniu zestawów danych zawierających dane osobowe, kluczowe do szkolenia modeli AI i umożliwienia testowania QA. Mimo że głównym celem nie jest rozwijanie nowych modeli, umiejętności modelowania będą uznane za cenną wartość dodaną.

Szukamy starszego członka zespołu, który może działać niezależnie i wprowadzać kreatywność do naszych operacji, zwiększając nasze oferty biznesowe i rozwiązania danych.

Rozwój reprezentatywnych zestawów danych, które naśladują dane klientów dla modułów szkoleniowych, wspomagając zespoły QA i developerskie.
Ekstrakcja wrażliwych danych dopasowanych do konkretnych produktów i wymagań klientów.

Udowodnione doświadczenie w rozwijaniu skomplikowanych pipeline'ów ETL, szczególnie tych obsługujących tekst i wzorce językowe.
Ekspertyza w Pythonie oraz narzędziach takich jak pandas, numpy, Gensim, spaCy, NLTK; biegłość w obsłudze baz danych SQL i NoSQL.
Wykazanie się starannością w jakości danych i głębokim zrozumieniem różnorodnych potrzeb biznesowych.
Umiejętność pisania modułowego kodu oraz udział w środowiskach współpracy, w tym w przeglądach kodu.
Doświadczenie we współpracy z programistami, menedżerami produktu i innymi interesariuszami w celu integracji rozwiązań danych i doskonalenia wymagań biznesowych.
Mocne umiejętności komunikacyjne ze zdolnością do jasnej i zorganizowanej dokumentacji oprogramowania i danych.

Doświadczenie w pracy z analizą tekstu i modelami uczenia maszynowego skupionymi na klasyfikacji tekstu i wykrywaniu bytów.
Zainteresowanie lub doświadczenie w web scrapingu, automatycznej kreacji treści, cyklach życia ML lub AI, pipeline'ach CI/CD oraz MLOps.
Ciekawość i chęć ciągłego informowania się o najnowszych trendach w dziedzinie uczenia maszynowego i sztucznej inteligencji.

Doświadczenie z wykorzystaniem Dużych Modeli Językowych (LLM) w realnych scenariuszach biznesowych, szczególnie w tworzeniu treści lub danych.
Znajomość platform ob