Científico de Datos

  • Full Time
Job expired!

Acerca de Cybersyn

Cybersyn es una nueva empresa de DaaS (datos como servicio), respaldada por Sequoia, Coatue y Snowflake. Nuestra misión es hacer transparentes los datos económicos del mundo para los gobiernos, las empresas y los emprendedores y habilitar una nueva generación de tomadores de decisiones. Adquirimos activos de datos únicos (empresas, licencias, derechos de datos, dividendos de consumidores) y construimos productos derivados sobre estos, centrándonos en medir en qué están gastando dinero los consumidores y las empresas. Puede pensar en Cybersyn como una combinación entre una firma de inversión y una empresa tecnológica enfocada en datos: si tenemos éxito, interrumpiremos el espacio tradicional de inteligencia de mercado. La recompensa es grande: si tenemos éxito, podemos interrumpir una industria valorada en $100B y construir SimCity para el mundo real.

Ya hemos lanzado un buen número de conjuntos de datos públicos que hemos limpiado, reestructurado y hecho combinables en Snowflake Marketplace.

  • Vea nuestros datos actuales aquí.

  • Haga una demostración de nuestros datos en nuestra aplicación Streamlit aquí.

Acerca del rol: 

Cybersyn busca un Científico de Datos para asumir los desafíos que surgen al modernizar el mundo de los datos económicos. Te unirás a un equipo increíblemente talentoso de científicos de datos y ingenieros orientados al producto y de ritmo rápido que trabajan para desarrollar soluciones novedosas a problemas estadísticos complejos y construir nuestra visión del producto de datos.

Lo que vas a hacer:

  • Crear productos de datos derivados que respondan a algunas de las preguntas más complejas e interesantes sobre la economía; en la práctica, esto significa:

    • Prototipar e implementar canalizaciones de procesamiento de datos y modelos estadísticos en Python/SQL/R que contribuirán a nuestra visión técnica

    • Aprovechar SQL, Python, dbt y herramientas de orquestación (por ejemplo, Dagster)

    • Trabajar estrechamente con ingenieros, ingenieros de análisis y gerentes de producto para ejecutar nuestro plan de trabajo

  • Presentar informes al Jefe de Ciencia de Datos y asistirles en la ejecución de nuestra visión de producto de datos.

Quién eres: 

  • Científico de datos con mentalidad comercial con capacidad para equilibrar el rigor técnico con una ejecución rápida y resultados procesables.

  • Al menos dos años de experiencia práctica en el desarrollo de modelos estadísticos y canalizaciones de datos para comprender datos imperfectos. Lea más sobre nuestra tesis aquí y aquí.

  • Historial comprobado de ejecución de proyectos de investigación práctica de principio a fin.

  • Se prefiere fuertemente la experiencia previa con datos alternativos de terceros.

  • La experiencia previa en los siguientes campos es un plus: métodos de muestreo e inferencia, análisis de datos panel, análisis de datos bayesianos, modelado de series temporales, normalización de datos, análisis numérico

  • La experiencia en Python/R y SQL es necesaria; idealmente ha trabajado con almacenes de datos en la nube antes (Snowflake, BigQuery, Redshift, etc.) 

    • Deberías tener buen criterio de cómo es un "código limpio", tener experiencia revisando Pull Requests y desarrollar estándares de codificación

    • Se prefiere fuertemente la experiencia previa con el trabajo con datos de gran tamaño.

  • La experiencia en dbt, AWS, Github es muy útil, pero no es estrictamente necesaria

Lo que obtienes de esto:

  • Capacidad para dar forma al producto inicial de Cybersyn, decisiones tecnológicas y propiedad de metodologías estadísticas y bibliotecas 

  • Acceso a algunos de los datos económicos más interesantes del mundo, incluyendo gastos en tiempo real, transacciones, clickstream, datos de fuentes de terceros y de primera mano. Muchos de nuestros datos no están disponibles para otras terceras partes 

  • Una cultura de movimiento rápido, mucha responsabilidad y autonomía desde el primer día.