Software Engineer, Analytics Data Infrastructure

Job expired!

¡Únete a nuestro innovador equipo de Infraestructura de Datos Analíticos en OpenAI!

Sobre el equipo: En OpenAI, el equipo de Análisis de la Plataforma de Investigación está a la vanguardia en el diseño, construcción y operación de estructuras fundamentales de datos y análisis esenciales para la investigación de IA. Nuestro objetivo es único: impulsar la investigación de IA hacia la AGI gestionando componentes críticos del stack de entrenamiento de investigación. Esto incluye todo, desde tuberías de procesamiento de datos avanzadas hasta bibliotecas sofisticadas que soportan nuestros modelos de entrenamiento distribuido, junto con proporcionar sistemas de observabilidad y análisis para mejorar la calidad de la investigación y gestionar el ciclo de vida de los datos a gran escala.

Visión general del puesto: Ingeniero de Software, Infraestructura de Datos Analíticos

Sobre el Rol: A medida que OpenAI se expande, requerimos ingenieros dedicados y capacitados para apoyar las crecientes demandas de nuestros investigadores e ingenieros. Tu rol implicará mejorar las tuberías de procesamiento de datos, mejorar los sistemas de observabilidad y ejecutar proyectos de gestión del ciclo de vida de los datos con un enfoque en eficiencia, seguridad y escalabilidad. Este puesto es ideal para aquellos con experiencia en escalar servicios de Kubernetes, depurar retrasos de consumidor de Kafka, diagnosticar fallos de sistemas distribuidos y desarrollar tuberías de procesamiento de datos de extremo a extremo. Ya sea que estés basado en San Francisco, CA, o prefieras trabajar de forma remota dentro de EE. UU., ofrecemos un modelo de trabajo híbrido flexible y asistencia para la reubicación.

Responsabilidades clave:

  • Tomar decisiones de arquitectura e ingeniería impactantes usando tu experiencia y conocimiento avanzados.
  • Mantener la seguridad, integridad y cumplimiento de nuestros datos en línea con los estándares de la industria y de la compañía.
  • Escalar nuestras plataformas de análisis y datos para apoyar un crecimiento sustancial.
  • Mejorar la productividad de la empresa desarrollando herramientas y sistemas de datos superiores para nuestro equipo.
  • Colaborar con varios equipos para introducir nuevas características y capacidades fundamentales.
  • Gestionar la fiabilidad del sistema y participar en una rotación de llamadas para respuestas críticas a incidentes.

¿Quién debería aplicar?

Probablemente seas un excelente candidato para este rol si:

  • Has construido tuberías de procesamiento de datos tanto en streaming como por lotes usando herramientas como Kafka, Spark o Flink.
  • Eres hábil en la gestión de infraestructuras modernas con sistemas como Kubernetes y Terraform.
  • Posees un fuerte interés o antecedentes en sistemas de observabilidad, particularmente en el contexto del entrenamiento de ML.
  • Tienes experiencia significativa en organizaciones de entrenamiento de ML, especialmente con transformaciones de datos previas al entrenamiento.
  • Eres un ingeniero de software competente con experiencia en Python y has gestionado grandes bases de código.
  • Has manejado la gestión del ciclo de vida de los datos en entornos de gran escala, abordando el control de acceso, movimiento de datos, gestión de metadatos, etc.
  • Prosperas en entornos de rápido movimiento y eres un iniciador proactivo.

Sobre OpenAI

OpenAI es una empresa líder en investigación y despliegue de IA destinada a garantizar los extensos beneficios de la IA de propósito general para la humanidad. Como empleador de igualdad de oportunidades, estamos comprometidos con la diversidad y la inclusión y damos la bienvenida a solicitantes de todos los antecedentes. Nos adherimos a prácticas de contratación justas y también proporcionamos adaptaciones para solicitantes con discapacidades