O Cybersyn
Cybersyn to nowatorska firma oferująca DaaS (Data-as-a-Service), wspierana przez Sequoia, Coatue i Snowflake. Naszym celem jest ujawnienie światowych danych gospodarczych dla rządów, przedsiębiorstw i przedsiębiorców oraz inspirowanie nowej fali osób podejmujących decyzje. Pozyskujemy wyjątkowe aktywa danych (firmy, prawa, prawa do danych, dywidendy od konsumentów) i tworzymy zaawansowane produkty oparte na nich, koncentrując się na wykrywaniu, gdzie konsumenci i firmy inwestują swoje pieniądze. Cybersyn można postrzegać jako połączenie firmy inwestycyjnej i organizacji technologicznej skupionej na danych: jeśli odniesiemy sukces, zrewolucjonizujemy tradycyjną sferę badań rynkowych. Nagroda jest znacząca - jeśli osiągniemy sukces, mamy potencjał do zakłócenia przemysłu wartego 100 miliardów dolarów i stworzenia SimCity dla prawdziwego świata.
Wprowadziliśmy już znaczną liczbę publicznych zestawów danych, które oczyściliśmy, sformatowaliśmy i udostępniliśmy na platformie Snowflake Marketplace.
Kliknij tutaj, aby zobaczyć nasze aktualne dane.
Wypróbuj nasze dane na naszej aplikacji Streamlit tutaj.
O roli:
Cybersyn poszukuje naukowca danych, który poradzi sobie z wyzwaniami, jakie napotykamy w procesie modernizacji świata danych gospodarczych. Będziesz częścią wyjątkowo zdolnego zespołu zwinnych naukowców danych i inżynierów skoncentrowanych na produkcie, którzy dążą do opracowania innowacyjnych rozwiązań skomplikowanych problemów statystycznych i rozwijania naszej wizji produktu z danymi.
Co będziesz robić:
Budować zaawansowane produkty z danymi, które odpowiadają na niektóre z najbardziej skomplikowanych i intrygujących pytań dotyczących gospodarki. W praktyce oznacza to:
- Prototypowanie i tworzenie przetwarzania strumieniowego danych i modeli statystycznych w Python/SQL/R, które przyczynią się do naszej technicznej wizji.
- Wykorzystywanie SQL, Python, dbt i narzędzi do zarządzania wykonaniem (np. Dagster)
- Ścisła współpraca z inżynierami oprogramowania, inżynierami analizy i menedżerami produktu w celu realizacji naszej drogi rozwoju
- Raportowanie do kierownika działu nauki danych i wspieranie go w realizacji naszej wizji produktu z danymi.
Kim jesteś:
- Komercyjnie zorientowanym naukowcem danych, z umiejętnością równoważenia precyzji technicznej z szybkim wykonaniem i stosownymi wynikami.
- Masz co najmniej dwa lata praktycznego doświadczenia w tworzeniu modeli statystycznych i przepływów danych do odczytywania niepełnych danych.
- Potwierdzony rekord wdrażania pragmatycznych projektów badawczych od początku do końca.
- Wcześniejsza znajomość alternatywnych, zewnętrznych danych jest mocno preferowana.
- Poprzednie doświadczenie w następujących dziedzinach to atut: metody próbkowania i wnioskowania, analiza danych panelowych, bayesowska analiza danych, modelowanie szeregów czasowych, normalizacja danych, analiza numeryczna.
- Biegłość w języku Python/R i SQL jest obowiązkowa; idealnie jeśli pracowałeś wcześniej z chmurą magazynów danych (Snowflake, BigQuery, Redshift, etc.)
- Powinieneś mieć solidne zrozumienie tego, jak wygląda "czysty kod", posiadać doświadczenie w recenzowaniu Pull Requestów i ustalaniu standardów kodowania. Wcześniejsze doświadczenie z obsługą dużych danych jest bardzo pożądane.
- Znajomość dbt, AWS, Github jest bardzo korzystna, ale nie jest ściśle konieczna.
Co z tego wyniknie:
- Możliwość kształtowania początkowego produktu Cybersyn, decyzji technologicznych oraz własnych metodologii statystycznych i bibliotek.
- Dostęp do niektórych z najbardziej interesujących danych gospodarczych na świecie, w tym danych dotyczących wydatków w czasie rzeczywistym, transakcji, strumieni kliknięć, danych zarówno z zewnętrznych, jak i wewnętrznych źródeł. Wiele z naszych danych nie jest dostępnych dla żadnych innych podmiotów trzecich.
- Szybkie tempo kultury, dużo odpowiedzialności i autonomii od pierwszego dnia.