Opis stanowiska:
- Współpraca ze zainteresowanymi stronami na różnych szczeblach organizacji w celu identyfikacji możliwości wykorzystania danych firmy w celu stworzenia rozwiązań biznesowych i osiągnięcia konkretnych wyników.
- Przenikliwe analizowanie danych z baz firmowych w celu promowania optymalizacji i udoskonalenia rozwoju produktu, strategii marketingowych i planów biznesowych.
- Ocena skuteczności i precyzji nowych źródeł danych i technik zbierania danych.
- Udzielanie wsparcia i współpraca z naszymi zespołami produktowymi, sprzedażowymi, kierownictwem i marketingu, dostarczając im wniosków wynikających z analizy danych firmy.
- Umiejętność wykorzystania dużych zbiorów danych do odkrywania możliwości optymalizacji produktu i procesu oraz wykorzystywanie modeli do testowania skuteczności różnych scenariuszy.
- Tworzenie unikalnych modeli danych i algorytmów do zastosowania na zestawach danych.
- Zastosowanie modelowania prognostycznego do zwiększenia i ulepszenia doświadczeń klienta, generowania przychodów, targetowania reklam i innych wyników biznesowych.
- Tworzenie firmowego ramy podziału A/B i testowania jakości modelu.
- Współpraca z różnymi zespołami funkcjonalnymi w celu wdrożenia modeli i monitorowania wyników.
- Tworzenie procesów i narzędzi do monitorowania i analizowania wydajności modeli i dokładności danych.
- Projektowanie paneli sterowania i raportów do wizualizacji danych (w tym korzystania z narzędzi takich jak Tableau, Power BI i podobnych do tworzenia interaktywnych paneli i raportów).
- Z entuzjazmem odkrywanie rozwiązań ukrytych w dużych zbiorach danych.
Wymagania:
- Wykształcenie wyższe w dziedzinie informatyki, informatyki biznesowej, inżynierii, finansów lub pokrewnych dziedzin.
- Co najmniej 5 lat doświadczenia w manipulowaniu zbiorami danych i tworzeniu modeli statystycznych, znajomość następującego oprogramowania/narzędzi:
- Znajomość programowania i doświadczenie w pracy z Java (preferowana ramka Spring).
- Biegłość w różnych technikach uczenia maszynowego (klastering, uczenie drzew decyzyjnych, sztuczne sieci neuronowe, itp.) i głębokie zrozumienie ich praktycznych korzyści i ograniczeń.
- Zrozumienie zaawansowanych technik i koncepcji statystycznych (regresja, właściwości rozkładów, testy statystyczne i ich precyzja, itp.) oraz znajomość zastosowań.
- Znajomość i doświadczenie w technikach statystycznych i data mining: GLM/Regresja, Random Forest, Boosting, Drzewa, text mining, analiza sieci społecznościowych, itp.
- Doświadczenie w korzystaniu z języków komputerowych do celów statystycznych (R, Python, SQL, itp.) dla manipulacji danymi i wydobywania wniosków z dużych zbiorów danych.
- Doświadczenie w pobieraniu danych z baz danych i korzystaniu z języków komputerowych do celów statystycznych: R, Python, SQL, itp. & korzystając z usług sieciowych: Redshift, S3, Spark, DigitalOcean, itp.
- Doświadczenie w tworzeniu i wykorzystywaniu zaawansowanych algorytmów uczenia maszynowego i statystyki: regresja, symulacja, analiza scenariuszy, modelowanie, klastering, drzewa decyzyjne, sieci neuronowe, itp.
- Doświadczenie w analizie danych z zewnętrznych źródeł: Google Analytics, Site Catalyst, Coremetrics, AdWords, Crimson Hexagon, Facebook Insights, itp.
- Doświadczenie z narzędziami do przetwarzania rozproszonych danych: Map/Reduce, Hadoop, Hive, Spark, Gurobi, MySQL, itp.
- Doświadczenie w wizualizacji/prezentowaniu danych dla zainteresowanych stron korzystając z: Periscope, Business Objects, D3, ggplot, itp.
- Doświadczenie w pracy z architekturami danych i tworzeniu ich.
- Zdolność i elastyczność do nauki i opanowywania nowych technologii i technik.
- Silne umiejętności rozwiązywania problemów z naciskiem na rozwój produktu.
- Doskonałe umiejętności komunikacji pisemnej i ustnej do koordynowania działań między zespołami.