Науковець-даних

Data Scientist
New York
$86 K - $155 K

Full Time

Job expired!

Про Cybersyn Cybersyn - це новий DaaS (data-as-a-service) фірма підтримується Sequoia, Coatue та Snowflake. Наша мета - відкрити світові економічні дані для урядів, підприємств та підприємців і надихати нову хвилю прийняття рішень. Ми закуповуємо унікальні об'єкти даних (компанії, права, права на дані, дивіденди споживачів) і конструюємо продвинуті продукти на їх основі, зосереджуючись на виявленні, куди споживачі та власники бізнесу спрямовують свої гроші. Cybersyn можна розглядати як суміш інвестиційної компанії та технологічної організації, що зосереджена на даних: якщо нам вдасться, ми перерозподілимо традиційну сферу ринкової розвідки. Винагорода велика - у разі успіху у нас є потенціал зруйнувати індустрію, вартість якої становить близько $100 мільярдів, і побудувати SimCity для справжнього світу. Ми вже представили значну кількість публічних наборів даних, які ми очистили, переформатували та зробили можливим з'єднання на Snowflake Marketplace. Клікніть тут, щоб побачити наші поточні дані. Спробуйте наші дані в нашому Streamlit App тут. Про роль: Cybersyn шукає Дата-науковця, щоб вирішити виклики, що виникають при модернізації світу економічних даних. Ви станете частиною винятково вмілої команди діячів, продукт-центрованих науковців і інженерів, які докладають зусиль для вироблення інноваційних рішень складних статистичних питань і формування нашого бачення даних продуктів. Що ви будете робити: Створюйте передові продукти даних, які відповідають на деякі з найбільш складних та захоплюючих питань про економіку. На практиці це означає: - Прототипізація та створення конвейерів обробки даних та статистичних моделей в Python/SQL/R, які в кінцевому рахунку сприятимуть нашій технічній візії. - Використання SQL, Python, dbt та інструментів оркестрації (наприклад, Dagster) - Тісне співробітництво з інженерами-програмістами, інженерами-аналітиками та менеджерами з продуктів для реалізації нашого плану - Підконтрольність Голові відділу датології та підтримка його в реалізації нашої візії даних продуктів. Хто ви: - Комерційно-орієнтований науковець з перевагою для даних, який вміє збалансувати технічну точність з швидким виконанням та конкретними результатами. - У вас є не менше двох років практичного досвіду роботи з розробкою статистичних моделей та конвейерів даних для розшифровки недосконалих даних. - Перевірений досвід імплементації прагматичних науково-дослідницьких проектів від початку до виконання. - Попереднє знайомство з альтернативними, даними третіх сторін, є сильно вподобаним. - Попередній досвід в наступних галузях є величезним плюсом: методи вибірки та виведення, аналіз панельних даних, байєсівський аналіз даних, моделювання часових рядів, нормалізація даних, числовий аналіз. - Вам слід вільно володіти Python/R і SQL; ідеально, якщо ви вже мали досвід роботи з хмарними сховищами даних (Snowflake, BigQuery, Redshift та ін.) - Вам потрібно мати гарне уявлення про те, як виглядає "чистий код", мати досвід в рецензуванні Pull Requests та встановленні стандартів кодування. Попередній досвід роботи з великими даними високо цінується. - Знайомство з dbt, AWS, Github є дуже корисним, але не обов'язково необхідним. Що ви отримаєте від цього: - Можливість формувати початковий продукт Cybersyn, технологічні рішення та власні статистичні методики та бібліотеки. - Доступ до деяких з найбільш цікавих економічних даних у світі, включаючи реальні витрати в реальному часі, транзакції, потоки кліків, дані від третіх сторін та перших осіб. Багато наших даних не доступні жодним іншим третім сторонам. - Швидкотемпова культура, багато відповідальності та автономії з самого початку.