Científico de Datos
- Data Scientist
- New York
- $86 K - $155 K
- Full Time
Acerca de Cybersyn
Cybersyn es una nueva empresa de DaaS (datos como servicio), respaldada por Sequoia, Coatue y Snowflake. Nuestra misión es hacer transparentes los datos económicos del mundo para los gobiernos, las empresas y los emprendedores y habilitar una nueva generación de tomadores de decisiones. Adquirimos activos de datos únicos (empresas, licencias, derechos de datos, dividendos de consumidores) y construimos productos derivados sobre estos, centrándonos en medir en qué están gastando dinero los consumidores y las empresas. Puede pensar en Cybersyn como una combinación entre una firma de inversión y una empresa tecnológica enfocada en datos: si tenemos éxito, interrumpiremos el espacio tradicional de inteligencia de mercado. La recompensa es grande: si tenemos éxito, podemos interrumpir una industria valorada en $100B y construir SimCity para el mundo real.
Ya hemos lanzado un buen número de conjuntos de datos públicos que hemos limpiado, reestructurado y hecho combinables en Snowflake Marketplace.
Vea nuestros datos actuales aquí.
Haga una demostración de nuestros datos en nuestra aplicación Streamlit aquí.
Acerca del rol:
Cybersyn busca un Científico de Datos para asumir los desafíos que surgen al modernizar el mundo de los datos económicos. Te unirás a un equipo increíblemente talentoso de científicos de datos y ingenieros orientados al producto y de ritmo rápido que trabajan para desarrollar soluciones novedosas a problemas estadísticos complejos y construir nuestra visión del producto de datos.
Lo que vas a hacer:
Crear productos de datos derivados que respondan a algunas de las preguntas más complejas e interesantes sobre la economía; en la práctica, esto significa:
Prototipar e implementar canalizaciones de procesamiento de datos y modelos estadísticos en Python/SQL/R que contribuirán a nuestra visión técnica.
Aprovechar SQL, Python, dbt y herramientas de orquestación (por ejemplo, Dagster)
Trabajar estrechamente con ingenieros, ingenieros de análisis y gerentes de producto para ejecutar nuestro plan de trabajo
Presentar informes al Jefe de Ciencia de Datos y asistirles en la ejecución de nuestra visión de producto de datos.
Quién eres:
Científico de datos con mentalidad comercial con capacidad para equilibrar el rigor técnico con una ejecución rápida y resultados procesables.
Al menos dos años de experiencia práctica en el desarrollo de modelos estadísticos y canalizaciones de datos para comprender datos imperfectos. Lea más sobre nuestra tesis aquí y aquí.
Historial comprobado de ejecución de proyectos de investigación práctica de principio a fin.
Se prefiere fuertemente la experiencia previa con datos alternativos de terceros.
La experiencia previa en los siguientes campos es un plus: métodos de muestreo e inferencia, análisis de datos panel, análisis de datos bayesianos, modelado de series temporales, normalización de datos, análisis numérico
La experiencia en Python/R y SQL es necesaria; idealmente ha trabajado con almacenes de datos en la nube antes (Snowflake, BigQuery, Redshift, etc.)
Deberías tener buen criterio de cómo es un "código limpio", tener experiencia revisando Pull Requests y desarrollar estándares de codificación
Se prefiere fuertemente la experiencia previa con el trabajo con datos de gran tamaño.
La experiencia en dbt, AWS, Github es muy útil, pero no es estrictamente necesaria
Lo que obtienes de esto:
Capacidad para dar forma al producto inicial de Cybersyn, decisiones tecnológicas y propiedad de metodologías estadísticas y bibliotecas
Acceso a algunos de los datos económicos más interesantes del mundo, incluyendo gastos en tiempo real, transacciones, clickstream, datos de fuentes de terceros y de primera mano. Muchos de nuestros datos no están disponibles para otras terceras partes
Una cultura de movimiento rápido, mucha responsabilidad y autonomía desde el primer día.