Software Engineer

Software Engineer
London
06/29/2024
-

Job expired!

Компания: FactSet

Должность: Инженер-программист

FactSet активно ищет опытного инженера-программиста с обширным опытом в облачной архитектуре AWS, развертывании инфраструктуры и её обслуживании. Эта роль включает сотрудничество с другими инженерами для развертывания приложений, интегрированных с моделями машинного обучения (ML), ориентированными на обработку естественного языка (NLP), классификацию и большие языковые модели (LLMs).

Инженер-программист будет играть ключевую роль в разработке стратегической дорожной карты по управлению и расширению существующих конвейеров и инфраструктуры, поддерживающих ML и AI решения. Основные задачи включают:

Развертывание и обслуживание моделей ML, баз данных и приложений.
Поддержка различных проектов AI/ML, включая моделирование сущностей и тем, семантическую разметку/обогащение, извлечение информации и интеграцию LLMs в существующие структуры.
Создание панелей мониторинга и визуализаций для финансовых экспертов.
Поглощение и анализ как структурированных, так и неструктурированных данных.
Разработка процессов для сбора данных, оценки их качества и контроля.
Поддержание осведомленности о технологических достижениях и обмен знаниями и страстью к ML и технологиям с командой.
Сотрудничество с другими инженерными командами для непрерывного улучшения.

Идеальный кандидат будет обладать:

Степенью бакалавра или магистра в области компьютерных наук или смежной области.
5+ лет опыта работы инженером-программистом.
Опыт управления облачной инфраструктурой на AWS.
Опыт работы с ML и NLP.
Прочная основа в написании и выпуске производственного кода в корпоративной среде.
Сильные аналитические навыки и командный настрой.
Свободное владение английским языком и умение объяснять сложные темы нетехническим заинтересованным сторонам.
Высокий уровень владения Python.
Знание Docker и разработки API.
Опыт работы с различными службами AWS (например, SageMaker, S3, Athena, Glue, ECS, EC2).

Дополнительные желательные навыки включают:

Опыт работы с RDF, triple stores и извлечением отношений.
Обработка больших объемов данных в потоковых или пакетных средах.
Использование MongoDB.
Знание библиотек глубинного обучения (Keras, PyTorch, TensorFlow).
Опыт работы с инструментами больших данных (Pyspark, Hive).
Экспертиза в извлечении информации, разборе и сегментации текста.
Понимание онтологий, разрешения таксономий и дизамбигуации.
Опыт работы с методами ненаблюдаемого обучения, включая оценку плотности, кластеризацию и моделирование тем.
Знание графовых баз данных (AWS Neptune, Neo4j).
Опыт работы с фреймворками машинного обучения, такими как sklearn, и рабочими процессами ML.
Знание библиотек NLP и инструментов предобработки текста (nltk, SpaCy).
Уверенность в работе с фреймворками больших языковых моделей, такими как OpenAI и Llama.
Опыт работы с неструктурированными данными (например, текстовым контентом, JSON-записями), включая инженеринг признаков.