Naukowiec danych

Data Scientist
New York
$86 K - $155 K

Full Time

Job expired!

O Cybersyn Cybersyn to nowatorska firma oferująca DaaS (Data-as-a-Service), wspierana przez Sequoia, Coatue i Snowflake. Naszym celem jest ujawnienie światowych danych gospodarczych dla rządów, przedsiębiorstw i przedsiębiorców oraz inspirowanie nowej fali osób podejmujących decyzje. Pozyskujemy wyjątkowe aktywa danych (firmy, prawa, prawa do danych, dywidendy od konsumentów) i tworzymy zaawansowane produkty oparte na nich, koncentrując się na wykrywaniu, gdzie konsumenci i firmy inwestują swoje pieniądze. Cybersyn można postrzegać jako połączenie firmy inwestycyjnej i organizacji technologicznej skupionej na danych: jeśli odniesiemy sukces, zrewolucjonizujemy tradycyjną sferę badań rynkowych. Nagroda jest znacząca - jeśli osiągniemy sukces, mamy potencjał do zakłócenia przemysłu wartego 100 miliardów dolarów i stworzenia SimCity dla prawdziwego świata. Wprowadziliśmy już znaczną liczbę publicznych zestawów danych, które oczyściliśmy, sformatowaliśmy i udostępniliśmy na platformie Snowflake Marketplace. Kliknij tutaj, aby zobaczyć nasze aktualne dane. Wypróbuj nasze dane na naszej aplikacji Streamlit tutaj. O roli: Cybersyn poszukuje naukowca danych, który poradzi sobie z wyzwaniami, jakie napotykamy w procesie modernizacji świata danych gospodarczych. Będziesz częścią wyjątkowo zdolnego zespołu zwinnych naukowców danych i inżynierów skoncentrowanych na produkcie, którzy dążą do opracowania innowacyjnych rozwiązań skomplikowanych problemów statystycznych i rozwijania naszej wizji produktu z danymi. Co będziesz robić: Budować zaawansowane produkty z danymi, które odpowiadają na niektóre z najbardziej skomplikowanych i intrygujących pytań dotyczących gospodarki. W praktyce oznacza to: - Prototypowanie i tworzenie przetwarzania strumieniowego danych i modeli statystycznych w Python/SQL/R, które przyczynią się do naszej technicznej wizji. - Wykorzystywanie SQL, Python, dbt i narzędzi do zarządzania wykonaniem (np. Dagster) - Ścisła współpraca z inżynierami oprogramowania, inżynierami analizy i menedżerami produktu w celu realizacji naszej drogi rozwoju - Raportowanie do kierownika działu nauki danych i wspieranie go w realizacji naszej wizji produktu z danymi. Kim jesteś: - Komercyjnie zorientowanym naukowcem danych, z umiejętnością równoważenia precyzji technicznej z szybkim wykonaniem i stosownymi wynikami. - Masz co najmniej dwa lata praktycznego doświadczenia w tworzeniu modeli statystycznych i przepływów danych do odczytywania niepełnych danych. - Potwierdzony rekord wdrażania pragmatycznych projektów badawczych od początku do końca. - Wcześniejsza znajomość alternatywnych, zewnętrznych danych jest mocno preferowana. - Poprzednie doświadczenie w następujących dziedzinach to atut: metody próbkowania i wnioskowania, analiza danych panelowych, bayesowska analiza danych, modelowanie szeregów czasowych, normalizacja danych, analiza numeryczna. - Biegłość w języku Python/R i SQL jest obowiązkowa; idealnie jeśli pracowałeś wcześniej z chmurą magazynów danych (Snowflake, BigQuery, Redshift, etc.) - Powinieneś mieć solidne zrozumienie tego, jak wygląda "czysty kod", posiadać doświadczenie w recenzowaniu Pull Requestów i ustalaniu standardów kodowania. Wcześniejsze doświadczenie z obsługą dużych danych jest bardzo pożądane. - Znajomość dbt, AWS, Github jest bardzo korzystna, ale nie jest ściśle konieczna. Co z tego wyniknie: - Możliwość kształtowania początkowego produktu Cybersyn, decyzji technologicznych oraz własnych metodologii statystycznych i bibliotek. - Dostęp do niektórych z najbardziej interesujących danych gospodarczych na świecie, w tym danych dotyczących wydatków w czasie rzeczywistym, transakcji, strumieni kliknięć, danych zarówno z zewnętrznych, jak i wewnętrznych źródeł. Wiele z naszych danych nie jest dostępnych dla żadnych innych podmiotów trzecich. - Szybkie tempo kultury, dużo odpowiedzialności i autonomii od pierwszego dnia.