Senior/Principal Data Scientist - NLP (Remote)

Job expired!

Únase a Veeva Systems, una empresa pionera impulsada por la misión de soluciones en la nube para la industria, dedicada a acelerar la entrega de terapias para las ciencias de la vida. Como una de las empresas de SaaS de más rápido crecimiento, logramos más de $2B en ingresos el último año fiscal, con oportunidades de crecimiento ilimitadas por delante.

En Veeva, nuestros valores son primordiales: Hacer lo Correcto, Éxito del Cliente, Éxito del Empleado y Velocidad. En 2021, nos convertimos en una corporación de beneficio público (PBC), legalmente comprometidos a equilibrar los intereses de los clientes, empleados, la sociedad y los inversionistas.

Adopte la libertad de trabajar desde cualquier lugar, ya sea desde casa o desde la oficina, para sobresalir en su entorno ideal. Únase a nosotros para transformar la industria de las ciencias de la vida, haciendo un impacto positivo en nuestros clientes, empleados y comunidades.

Veeva está en una misión para agilizar la entrada al mercado de productos en las industrias de Ciencias de la Vida y Reguladas. Arraigados en nuestros valores fundamentales: Hacer lo Correcto, Éxito del Cliente, Éxito del Empleado y Velocidad, nuestros equipos crean software en la nube transformador, servicios, consultoría y soluciones de datos para mejorar la eficiencia y efectividad de nuestros clientes.

Como una Corporación de Beneficio Público, será parte de una empresa comprometida en impactar positivamente a sus clientes, empleados y comunidades. El producto Link de Veeva es fundamental en nuestro ecosistema, conectando ciencias de la vida con individuos clave para impulsar la investigación y la atención médica.

Su rol implicará desarrollar agentes basados en LLM para extraer información detallada sobre Líderes de Opinión Clave (KOLs) en el sector de la salud, utilizando infraestructura en la nube para el desarrollo de modelos, y colaborando con un equipo dedicado para refinar y desplegar estos modelos.

Buscamos revolucionar los estándares de la industria a través de modelos avanzados de ML, auxiliados por más de 2000 curadores, asegurando calidad y escalabilidad a través de regiones, idiomas y especialidades médicas.

Ubicación: Remoto en los Países Bajos, el Reino Unido o España. Los candidatos deben residir y estar legalmente autorizados para trabajar en uno de estos países sin el soporte de visa o reubicación de Veeva.

Lo que Harás

  • Adoptar las últimas tecnologías y tendencias de NLP para tu plataforma.
  • Desarrollar agentes basados en LLM para una interacción y recuperación de datos mejorada.
  • Aprovechar métodos RLHF como Direct Preference Optimization (DPO) y Proximal Policy Optimization (PPO).
  • Diseñar una canalización de extremo a extremo para extracción de información de datos no estructurados a gran escala.
  • Crear una funcionalidad de búsqueda semántica robusta para responder eficazmente a las consultas de los usuarios.
  • Utilizar técnicas como reconocimiento de entidades nombradas, enlazado de entidades, llenado de ranuras, aprendizaje de pocos disparos, entre otras para extracción de información.
  • Analizar e interpretar modelos de datos según la fuente y región.
  • Colaborar con equipos de calidad de datos para la evaluación cualitativa y cuantitativa de modelos.
  • Utilizar infraestructura en la nube en el desarrollo de modelos, asegurando un despliegue eficiente junto a desarrolladores de software e ingenieros DevOps.

Requisitos

  • Más de 4 años como Científico de Datos (o más de 2 años con un doctorado).
  • Máster o doctorado en Informática, IA, Lingüística Computacional o campo relacionado.
  • Sólidos conocimientos teóricos en NLP, ML y Deep Learning.
  • Experiencia comprobada con LLMs y arquitecturas de transformadores (por ejemplo, GPT, BERT).
  • Competente en Python y bibliotecas NLP (por ejemplo, NLTK, SpaCy, Hugging Face Transformers).
  • Experiencia con marcos BigData (por ejemplo, Ray, Spark) y marcos de Deep Learning (por ejemplo, PyTorch, JAX).