Lead Data Scientist - NLP & Gen AI

Job expired!

Ubicación: Guildford/Híbrido

Salario: Dependiendo de la experiencia + Asignación de coche + Bono anual + Beneficios

Allianz es una compañía de seguros global que opera en 70 países. Desde el primer día, sentirás el valor de tus contribuciones, ya que ofrecemos oportunidades de aprendizaje y desarrollo profesional de clase mundial dentro de una cultura inclusiva.

Como Científico de Datos Líder (NLP y GenAI) en Allianz Comercial, colaborarás con científicos de datos, ingenieros de datos, ingenieros de ML y analistas para diseñar e implementar soluciones que extraen información de datos de texto no estructurados. Participarás en diversos proyectos, incluyendo modelado de temas, reconocimiento de entidades, generación de texto, creación de ontologías e IA conversacional. Este rol requiere una sólida base en NLP, fuertes habilidades técnicas y una pasión por la innovación y la resolución de problemas.

Responsabilidades

  • Implementar la estrategia arquitectónica y hoja de ruta de ML/GenAI adaptada a la visión y objetivos estratégicos de los interesados comerciales.
  • Investigar, diseñar y desarrollar soluciones utilizando modelos y algoritmos de NLP para extraer información de datos de texto no estructurados.
  • Colaborar con ingenieros de datos para preprocesar y limpiar datos de texto para compatibilidad con modelos de NLP.
  • Aplicar técnicas de aprendizaje automático y profundo para clasificación de texto, reconocimiento de entidades nombradas, búsqueda de conocimiento, modelado de temas y generación de texto.
  • Construir y aprovechar grafos de conocimiento para mejorar la comprensión del lenguaje y habilitar aplicaciones avanzadas de NLP.
  • Arquitectar y abogar por tecnologías de IA/ML que se integren sin problemas con los sistemas existentes.
  • Desarrollar métodos para utilizar LLMs como GPT, BERT y LLMs fundamentales de código abierto (Llama2) para tareas de comprensión y generación de lenguaje natural.
  • Realizar análisis exploratorios de datos para obtener información sobre datos de texto y desarrollar estrategias de preprocesamiento efectivas.
  • Integrar modelos de NLP en nuestras canalizaciones de datos y sistemas en colaboración con ingenieros de MLops.
  • Evaluar y realizar pruebas comparativas de algoritmos de NLP, marcos de grafos de conocimiento y arquitecturas LLM, recomendando enfoques adecuados para casos de uso específicos.
  • Mantenerse actualizado con las últimas investigaciones y avances en NLP, grafos de conocimiento y LLM para mejorar nuestras capacidades de NLP.
  • Comunicar hallazgos a interesados técnicos y no técnicos a través de informes, visualizaciones y presentaciones.
  • Colaborar con equipos multifuncionales para definir objetivos del proyecto, requisitos y métricas de éxito.
  • Interactuar con arquitectos empresariales e ingenieros de MLOps para probar casos de uso y discutir configuraciones arquitectónicas.
  • Mentorar y guiar a los miembros junior del equipo para fomentar su crecimiento en NLP.

Sobre ti

  • Título de licenciatura o maestría en Ciencias de la Computación, Ciencia de Datos o un campo relacionado, o experiencia equivalente.
  • Experiencia demostrada como Científico de Datos con un enfoque en NLP y grafos de conocimiento. Familiaridad con Azure Open AI y varios LLMs fundamentales para Generación Aumentada por Recuperación (RAG) es deseable.
  • Experiencia con aprendizaje automático en grafos (por ejemplo, redes neuronales de grafos, ciencia de datos de grafos) y aplicaciones prácticas, incluyendo la creación de grafos de conocimiento y lenguajes de consulta como Cypher.
  • Experiencia con arquitectura de LLM (por ejemplo, Transformer, GANs, VAEs), ajuste fino de PEFT/LoRA, incrustación de contexto, bases de datos vectoriales y técnicas de búsqueda semántica.
  • Dominio de Python y bibliotecas de NLP como NLTK, spaCy, Transformers, Hugging Face, BERT y marcos de Gen AI como Llangchain y Llamaindex.
  • Experiencia con marcos de aprendizaje profundo como TensorFlow o PyTorch.
  • Familiaridad con servicios de