Ubicación: Guildford/Híbrido
Salario: Dependiendo de la experiencia + Asignación de coche + Bono anual + Beneficios
Allianz es una compañía de seguros global que opera en 70 países. Desde el primer día, sentirás el valor de tus contribuciones, ya que ofrecemos oportunidades de aprendizaje y desarrollo profesional de clase mundial dentro de una cultura inclusiva.
Como Científico de Datos Líder (NLP y GenAI) en Allianz Comercial, colaborarás con científicos de datos, ingenieros de datos, ingenieros de ML y analistas para diseñar e implementar soluciones que extraen información de datos de texto no estructurados. Participarás en diversos proyectos, incluyendo modelado de temas, reconocimiento de entidades, generación de texto, creación de ontologías e IA conversacional. Este rol requiere una sólida base en NLP, fuertes habilidades técnicas y una pasión por la innovación y la resolución de problemas.
Responsabilidades
- Implementar la estrategia arquitectónica y hoja de ruta de ML/GenAI adaptada a la visión y objetivos estratégicos de los interesados comerciales.
- Investigar, diseñar y desarrollar soluciones utilizando modelos y algoritmos de NLP para extraer información de datos de texto no estructurados.
- Colaborar con ingenieros de datos para preprocesar y limpiar datos de texto para compatibilidad con modelos de NLP.
- Aplicar técnicas de aprendizaje automático y profundo para clasificación de texto, reconocimiento de entidades nombradas, búsqueda de conocimiento, modelado de temas y generación de texto.
- Construir y aprovechar grafos de conocimiento para mejorar la comprensión del lenguaje y habilitar aplicaciones avanzadas de NLP.
- Arquitectar y abogar por tecnologías de IA/ML que se integren sin problemas con los sistemas existentes.
- Desarrollar métodos para utilizar LLMs como GPT, BERT y LLMs fundamentales de código abierto (Llama2) para tareas de comprensión y generación de lenguaje natural.
- Realizar análisis exploratorios de datos para obtener información sobre datos de texto y desarrollar estrategias de preprocesamiento efectivas.
- Integrar modelos de NLP en nuestras canalizaciones de datos y sistemas en colaboración con ingenieros de MLops.
- Evaluar y realizar pruebas comparativas de algoritmos de NLP, marcos de grafos de conocimiento y arquitecturas LLM, recomendando enfoques adecuados para casos de uso específicos.
- Mantenerse actualizado con las últimas investigaciones y avances en NLP, grafos de conocimiento y LLM para mejorar nuestras capacidades de NLP.
- Comunicar hallazgos a interesados técnicos y no técnicos a través de informes, visualizaciones y presentaciones.
- Colaborar con equipos multifuncionales para definir objetivos del proyecto, requisitos y métricas de éxito.
- Interactuar con arquitectos empresariales e ingenieros de MLOps para probar casos de uso y discutir configuraciones arquitectónicas.
- Mentorar y guiar a los miembros junior del equipo para fomentar su crecimiento en NLP.
Sobre ti
- Título de licenciatura o maestría en Ciencias de la Computación, Ciencia de Datos o un campo relacionado, o experiencia equivalente.
- Experiencia demostrada como Científico de Datos con un enfoque en NLP y grafos de conocimiento. Familiaridad con Azure Open AI y varios LLMs fundamentales para Generación Aumentada por Recuperación (RAG) es deseable.
- Experiencia con aprendizaje automático en grafos (por ejemplo, redes neuronales de grafos, ciencia de datos de grafos) y aplicaciones prácticas, incluyendo la creación de grafos de conocimiento y lenguajes de consulta como Cypher.
- Experiencia con arquitectura de LLM (por ejemplo, Transformer, GANs, VAEs), ajuste fino de PEFT/LoRA, incrustación de contexto, bases de datos vectoriales y técnicas de búsqueda semántica.
- Dominio de Python y bibliotecas de NLP como NLTK, spaCy, Transformers, Hugging Face, BERT y marcos de Gen AI como Llangchain y Llamaindex.
- Experiencia con marcos de aprendizaje profundo como TensorFlow o PyTorch.
- Familiaridad con servicios de