Científico de Investigación de GenAI, Equipo Post-Entrenamiento

  • Full Time
Job expired!

Descripción de la empresa

Fundada a finales del 2020 por un pequeño grupo de investigadores de aprendizaje automático, MosaicML permite a las empresas crear modelos de IA de última generación desde cero con sus propios datos. Desde una perspectiva comercial, MosaicML está comprometida con la creencia de que los modelos de IA de una empresa son tan valiosos como cualquier otra propiedad intelectual principal, y que los modelos de IA de alta calidad deberían estar disponibles para todos. Desde una perspectiva científica, MosaicML se compromete a reducir el costo de entrenar modelos de última generación - y a compartir nuestros conocimientos sobre cómo hacerlo con el mundo - para permitir que todos innoven y creen sus propios modelos.

Ahora parte de Databricks desde julio de 2023 como el equipo GenAI, estamos apasionados por permitir a nuestros clientes resolver los problemas más difíciles del mundo mediante la construcción y ejecución de la mejor plataforma de datos e IA del mundo. Aprovechamos cada oportunidad para resolver desafíos técnicos, esforzándonos por dotar a nuestros clientes de las mejores capacidades de datos e IA.

Descripción del trabajo

Como Científico de Investigación en el equipo GenAI de Databricks, serás responsable de mantenerse al día con los últimos avances en aprendizaje profundo y avanzar en la frontera científica creando nuevas técnicas que vayan más allá del estado del arte. Trabajarás en un equipo colaborativo de investigadores con diferentes antecedentes y formación técnica. Y lo más importante, amarás a nuestros clientes: nuestro objetivo es hacer que nuestros clientes tengan éxito cuando entrenan modelos grandes, y codificamos nuestra experiencia científica en nuestros productos para hacerlo posible.

Específicamente para la puesta a punto fina, RLHF, y después del entrenamiento, construirás sobre los modelos que hemos pre-entrenado para que puedan seguir instrucciones, refinando sus comportamientos para satisfacer mejor las necesidades de nuestros usuarios, y extendiéndolos a nuevas capacidades como contextos más largos, resoluciones más altas, uso de herramientas, etc. Estudiarás las últimas técnicas en estas áreas, las mejorarás para satisfacer nuestras necesidades, y las generalizarás para satisfacer las necesidades de nuestros clientes.

Serías un buen candidato si…

  • Te sientes cómodo trabajando con LLMs a gran escala en los 10s a 100s de miles de millones de parámetros.
  • Tienes sólidos habilidades de ingeniería de software ML y RL y habilidades de investigación científica.
  • Has producido investigaciones novedosas relacionadas con la puesta a punto fina de LLMs o mejorando LLMs pre-entrenados.
  • Tienes una experiencia especializada en temas como puesta a punto fina, RLHF, uso de herramientas LLM, etc.
  • Sientes pasión por llevar tu trabajo a manos de usuarios reales y -de manera más general- democratizar el acceso a la tecnología moderna de IA.
  • Estás motivado por trabajar en investigaciones de LLM que -a diferencia de la tendencia general en el campo- serán reveladas al público.
  • Tienes fuertes habilidades de comunicación y un deseo de trabajar en un equipo pequeño y de ritmo rápido.

Un doctorado NO es necesario para este puesto. Estamos abiertos a contratar candidatos con títulos de licenciatura y maestría y a recién graduados. Estamos abiertos a contratar candidatos que actualmente estén en roles de "ingeniero de investigación" en otras empresas.

Tus responsabilidades

  • Mantenerse al día con la literatura de investigación y pensar más allá del estado del arte para atender las necesidades de nuestros usuarios.
  • Desarrollar e implementar métodos que amplíen y mejoren las capacidades, la fiabilidad y la seguridad del modelo.
  • Evaluar rigurosamente estos métodos, comunicar los resultados de tus hallazgos y poner en producción los que sean útiles.

Transparencia en el rango salarial

Databricks está comprometido con prácticas de compensación justas y equitativas. El rango(s) salarial para este papel está listado abajo y representa el rango salarial base para roles no comisionables o ganancias objetivo para roles comisionables. La compensación real está basada en varios factores únicos para cada candidato, incluyendo pero no limitado a habilidades relacionadas con el trabajo, profundidad de experiencia, certificaciones relevantes y entrenamiento, y ubicación de trabajo específica. Basado en los factores anteriores, Databricks utiliza la totalidad del rango. El paquete total de compensación para este puesto también puede incluir elegibilidad para bonificación anual de rendimiento, equidad y los beneficios enumerados arriba. Para más información sobre en qué rango se encuentra tu ubicación visita nuestra página aquí.