Ingeniero de Datos
- Data Engineer
- New York
- $86 K - $149 K
- Full Time
Acerca de Cybersyn
Cybersyn es una nueva empresa DaaS (data-as-a-service), respaldada por Sequoia, Coatue y Snowflake. Nuestra misión es hacer que los datos económicos del mundo sean transparentes para los gobiernos, las empresas y los emprendedores y habilitar una nueva generación de tomadores de decisiones. Adquirimos activos de datos únicos (empresas, licencias, derechos de datos, dividendos de consumidores) y construimos productos derivados en base a ello, centrándonos en medir en qué gastan dinero los consumidores y las empresas. Puedes pensar en Cybersyn como una mezcla entre una firma de inversión y una empresa de tecnología centrada en datos: si tenemos éxito, interrumpiremos el espacio tradicional de inteligencia de mercado. La recompensa es grande: si tenemos éxito, podemos perturbar una industria que vale $100 mil millones y construir SimCity para el mundo real.
Ya hemos publicado un buen número de conjuntos de datos públicos que hemos limpiado, reestructurado y hecho combinables en el Mercado Snowflake.
Mira nuestros datos actuales aquí.
Prueba nuestros datos en nuestra aplicación Streamlit aquí.
Sobre el rol:
Cybersyn busca un ingeniero experimentado para ayudarnos a perfeccionar nuestra tecnología para nuestro equipo de ciencia de datos y producto e implementar canales de ingestión de fuentes de datos públicos y privados. Buscamos específicamente a alguien que tenga pasión por Snowflake Data Cloud y la optimización de costos y cargas de trabajo.
Lo que harás:
Ayudar a obtener datos de donde sea que estén a donde los necesitamos (en Snowflake): en la práctica, esto a menudo significa escribir trabajos para extraer, descargar o transformar datos de la manera más eficiente posible. Debes preocuparte por la eficiencia de cálculo y también por construir algún contexto sobre qué son realmente los datos.
Optimizar Snowflake para rendimiento y optimización de costos.
Proporcionar asesoramiento de infraestructura de las capacidades de Snowflake para acomodar casos de uso técnicos/negocios.
Proporcionar apoyo de producción para problemas del Almacén de Datos, tales como problemas de carga de datos, problemas de traducción de transformación, optimización de consultas.
Tomar posesión de punta a punta de tu trabajo y disfrutar trabajando con diferentes funciones en la empresa.
Quién eres:
Experiencia trabajando con múltiples conjuntos de datos (externos), limpiando, uniendo y manipulando datos; experiencia trabajando con fuentes de datos públicas (por ejemplo, Censo de EE. UU., Encuesta ACS) es una gran ventaja.
La experiencia con Snowflake es requisito.
La experiencia en Python y SQL es requisito.
La experiencia con dbt y sistemas orquestadores (Dagster, Prefect, Mage, Kestra, o algún equivalente) es muy valorada.
Experiencia en la construcción y operación de canales de datos para clientes reales en sistemas de producción.
Lo que obtienes a cambio:
Capacidad de influir en las decisiones tecnológicas iniciales de Cybersyn.
Acceso a algunos de los datos económicos más interesantes y grandes del mundo, incluyendo gastos en tiempo real, transacciones, datos de rastreo de clicks de fuentes de terceros y de primera mano.
Gran parte de nuestros datos no están disponibles para ninguna otra tercera parte.
Nuestro sistema está construido con fuentes de datos heterogéneas en mente: no estamos trabajando en datos de un solo producto o tema, sino en datos de gobiernos, sistemas de procesamiento de pagos (piensa en registros bancarios), dispositivos móviles y aplicaciones, y datos provenientes de SaaS (piensa en los datos recopilados por SaaS B2B)
Cultura de rápida evolución, mucha responsabilidad y autonomía desde el primer día.