MindTech, pionier w dostarczaniu kompleksowych rozwiązań w zakresie bezpieczeństwa danych i zgodności, poszukuje doświadczonego Szkoleniowca Danych / Data Scientist specjalizującego się w uczeniu maszynowym i przetwarzaniu języka naturalnego. Nasz idealny kandydat czuje się jak ryba w wodzie w zaawansowanym technologicznie środowisku, kształtując wysokiej jakości zestawy danych, aby poprawić rozwiązania oparte na danych we wszelkich obszarach biznesowych.
Szkoleniowiec Danych / Data Scientist będzie odgrywał kluczową rolę w generowaniu i zarządzaniu solidnymi zestawami danych wykorzystywanymi przez programistów AI/software, zespoły QA oraz inżynierów terenowych. Stanowisko to skupia się głównie na tworzeniu i utrzymywaniu zestawów danych zawierających dane osobowe, kluczowe do szkolenia modeli AI i umożliwienia testowania QA. Mimo że głównym celem nie jest rozwijanie nowych modeli, umiejętności modelowania będą uznane za cenną wartość dodaną.
Szukamy starszego członka zespołu, który może działać niezależnie i wprowadzać kreatywność do naszych operacji, zwiększając nasze oferty biznesowe i rozwiązania danych.
- Rozwój reprezentatywnych zestawów danych, które naśladują dane klientów dla modułów szkoleniowych, wspomagając zespoły QA i developerskie.
- Ekstrakcja wrażliwych danych dopasowanych do konkretnych produktów i wymagań klientów.
- Udowodnione doświadczenie w rozwijaniu skomplikowanych pipeline'ów ETL, szczególnie tych obsługujących tekst i wzorce językowe.
- Ekspertyza w Pythonie oraz narzędziach takich jak pandas, numpy, Gensim, spaCy, NLTK; biegłość w obsłudze baz danych SQL i NoSQL.
- Wykazanie się starannością w jakości danych i głębokim zrozumieniem różnorodnych potrzeb biznesowych.
- Umiejętność pisania modułowego kodu oraz udział w środowiskach współpracy, w tym w przeglądach kodu.
- Doświadczenie we współpracy z programistami, menedżerami produktu i innymi interesariuszami w celu integracji rozwiązań danych i doskonalenia wymagań biznesowych.
- Mocne umiejętności komunikacyjne ze zdolnością do jasnej i zorganizowanej dokumentacji oprogramowania i danych.
- Doświadczenie w pracy z analizą tekstu i modelami uczenia maszynowego skupionymi na klasyfikacji tekstu i wykrywaniu bytów.
- Zainteresowanie lub doświadczenie w web scrapingu, automatycznej kreacji treści, cyklach życia ML lub AI, pipeline'ach CI/CD oraz MLOps.
- Ciekawość i chęć ciągłego informowania się o najnowszych trendach w dziedzinie uczenia maszynowego i sztucznej inteligencji.
- Doświadczenie z wykorzystaniem Dużych Modeli Językowych (LLM) w realnych scenariuszach biznesowych, szczególnie w tworzeniu treści lub danych.
- Znajomość platform ob