Ingeniero de Datos

  • Full Time
Job expired!

Acerca de Cybersyn

Cybersyn es una nueva empresa DaaS (data-as-a-service), respaldada por Sequoia, Coatue y Snowflake. Nuestra misión es hacer que los datos económicos del mundo sean transparentes para los gobiernos, las empresas y los emprendedores y habilitar una nueva generación de tomadores de decisiones. Adquirimos activos de datos únicos (empresas, licencias, derechos de datos, dividendos de consumidores) y construimos productos derivados en base a ello, centrándonos en medir en qué gastan dinero los consumidores y las empresas. Puedes pensar en Cybersyn como una mezcla entre una firma de inversión y una empresa de tecnología centrada en datos: si tenemos éxito, interrumpiremos el espacio tradicional de inteligencia de mercado. La recompensa es grande: si tenemos éxito, podemos perturbar una industria que vale $100 mil millones y construir SimCity para el mundo real.

Ya hemos publicado un buen número de conjuntos de datos públicos que hemos limpiado, reestructurado y hecho combinables en el Mercado Snowflake.

  • Mira nuestros datos actuales aquí.

  • Prueba nuestros datos en nuestra aplicación Streamlit aquí.

Sobre el rol: 

Cybersyn busca un ingeniero experimentado para ayudarnos a perfeccionar nuestra tecnología para nuestro equipo de ciencia de datos y producto e implementar canales de ingestión de fuentes de datos públicos y privados. Buscamos específicamente a alguien que tenga pasión por Snowflake Data Cloud y la optimización de costos y cargas de trabajo.

Lo que harás:

  • Ayudar a obtener datos de donde sea que estén a donde los necesitamos (en Snowflake): en la práctica, esto a menudo significa escribir trabajos para extraer, descargar o transformar datos de la manera más eficiente posible. Debes preocuparte por la eficiencia de cálculo y también por construir algún contexto sobre qué son realmente los datos.

  • Optimizar Snowflake para rendimiento y optimización de costos.

  • Proporcionar asesoramiento de infraestructura de las capacidades de Snowflake para acomodar casos de uso técnicos/negocios.

  • Proporcionar apoyo de producción para problemas del Almacén de Datos, tales como problemas de carga de datos, problemas de traducción de transformación, optimización de consultas.

  • Tomar posesión de punta a punta de tu trabajo y disfrutar trabajando con diferentes funciones en la empresa.

Quién eres:

  • Experiencia trabajando con múltiples conjuntos de datos (externos), limpiando, uniendo y manipulando datos; experiencia trabajando con fuentes de datos públicas (por ejemplo, Censo de EE. UU., Encuesta ACS) es una gran ventaja.

  • La experiencia con Snowflake es requisito.

  • La experiencia en Python y SQL es requisito.

  • La experiencia con dbt y sistemas orquestadores (Dagster, Prefect, Mage, Kestra, o algún equivalente) es muy valorada.

  • Experiencia en la construcción y operación de canales de datos para clientes reales en sistemas de producción.

Lo que obtienes a cambio:

  • Capacidad de influir en las decisiones tecnológicas iniciales de Cybersyn.

  • Acceso a algunos de los datos económicos más interesantes y grandes del mundo, incluyendo gastos en tiempo real, transacciones, datos de rastreo de clicks de fuentes de terceros y de primera mano.

    • Gran parte de nuestros datos no están disponibles para ninguna otra tercera parte.

    • Nuestro sistema está construido con fuentes de datos heterogéneas en mente: no estamos trabajando en datos de un solo producto o tema, sino en datos de gobiernos, sistemas de procesamiento de pagos (piensa en registros bancarios), dispositivos móviles y aplicaciones, y datos provenientes de SaaS (piensa en los datos recopilados por SaaS B2B) 

  • Cultura de rápida evolución, mucha responsabilidad y autonomía desde el primer día.