Lead Data Scientist - NLP & Gen AI

Job expired!

Местоположение: Гилдфорд/Гибрид

Зарплата: В зависимости от опыта + Надбавка на автомобиль + Ежегодный бонус + Льготы

Allianz — это глобальная страховая компания, работающая в 70 странах. С первого дня вы ощутите ценность своих вкладов, так как мы предлагаем мирового класса обучение и возможности для карьерного роста в инклюзивной культуре.

Как Ведущий специалист по данным (NLP & GenAI) в Allianz Commercial, вы будете сотрудничать с дата-сайентистами, инженерами данных, ML-инженерами и аналитиками для разработки и внедрения решений, извлекающих информацию из неструктурированных текстовых данных. Вы будете участвовать в различных проектах, включая моделирование тем, распознавание сущностей, генерацию текста, создание онтологий и разработку разговорного ИИ. Эта роль требует прочных знаний в области NLP, сильных технических навыков и страсти к инновациям и решению проблем.

  • Реализация стратегического плана и дорожной карты ML/GenAI, адаптированных к видению и стратегическим целям бизнес-стейкхолдеров.
  • Исследование, проектирование и разработка решений с использованием моделей и алгоритмов NLP для извлечения информации из неструктурированных текстовых данных.
  • Сотрудничество с инженерами данных для предварительной обработки и очистки текстовых данных для совместимости с моделями NLP.
  • Применение методов машинного обучения и глубокого обучения для классификации текстов, распознавания именованных сущностей, поиска знаний, моделирования тем и генерации текста.
  • Создание и использование графов знаний для улучшения понимания языка и разработки передовых приложений NLP.
  • Проектирование и защита технологий AI/ML, которые интегрируются с существующими системами.
  • Разработка методов использования LLM, таких как GPT, BERT и Llama2 для задач понимания и генерации естественного языка.
  • Проведение разведывательного анализа данных для получения информации из текстовых данных и разработки эффективных стратегий предварительной обработки.
  • Интеграция моделей NLP в наши данные и системы в сотрудничестве с MLops-инженерами.
  • Оценка и сравнение алгоритмов NLP, фреймворков графов знаний и архитектур LLM, рекомендации подходящих подходов для конкретных сценариев.
  • Отслеживание последних исследований и достижений в области NLP, графов знаний и LLM для улучшения наших возможностей NLP.
  • Передача результатов техническим и нетехническим стейкхолдерам через отчеты, визуализации и презентации.
  • Сотрудничество с кросс-функциональными командами для определения целей проекта, требований и метрик успеха.
  • Взаимодействие с корпоративными архитекторами и инженерами MLOps для тестирования использования и обсуждения архитектурных конфигураций.
  • Наставничество и руководство младшими членами команды для содействия их росту в области NLP.
  • Степень бакалавра или магистра в области компьютерных наук, наук о данных или смежных областях, или эквивалентный опыт.
  • Доказанный опыт работы в качестве Data Scientist с фокусом на NLP и графах знаний. Желательно знание Azure Open AI и различных фундаментальных LLM для Retrieval Augmented Generation (RAG).
  • Опыт работы с графовым машинным обучением (например, графовые нейронные сети, наука о графах данных) и их практическими приложениями, включая создание графов знаний и языки запросов, такие как Cypher.
  • Опыт работы с архитектурами LLM (например, Transformer, GANs, VAEs), настройка PEFT/LoRA, контекстное встраивание, базы данных векторов и методы семантического поиска.
  • Знание Python и библиотек NLP, таких как NLTK, spaCy, Transformers, Hugging Face, BERT, а также фрейм