Старший инженер по машинному обучению

  • Full Time
Job expired!

О роли

Компания Abnormal Security ищет старшего инженера по машинному обучению, который станет частью команды Детекции и Принятия Решений о Сообщениях. В компании Abnormal мы стремимся защищать наших клиентов от злонамеренных участников, которые постоянно улучшают свои стратегии и техники, чтобы перехитрить и подрезать обычные процедуры безопасности. Именно поэтому наша оригинальная стратегия, основанная на поведении, так... необычна. Abnormal постоянно входит в список лучших стартапов в области кибербезопасности, а наша система искусственного интеллекта помогла нам получить различные премии в области кибербезопасности, благодаря чему нам доверяют охрану более 8% компаний из списка Fortune 1000 (и количество продолжает расти).

В условиях, когда одна успешная атака может привести к финансовым убыткам в миллионы долларов, команда Детекции и Принятия Решений о Сообщениях играет центральную роль в разработке высокоточного Движка Детекции, способного функционировать с сотнями миллионов сообщений с миллисекундной задержкой. Все письма, обрабатываемые Abnormal, проходят через рабочий процесс, управляемый этой командой, которая применяет сотни сигналов и детекторов к сообщению, в зависимости от контекста сообщения и пользователя. Затем система вычисляет итоговое общее решение для системы и затем регистрирует атрибуцию для управления различными офлайн и онлайн метриками, такими как офлайн точность, онлайн точность, онлайн коеффициент ложноотрицательных результатов и так далее.

Команда решает многослойную задачу детекции, которая включает моделирование образцов коммуникации для установления базовых линий по всему предприятию. Включая эти образцы как надежные сигналы и объединяя их с контекстуальной информацией, они создают системы с высокой точностью. Команда создает дискриминационные сигналы на разных уровнях, включая уровень сообщения (например, наличие определенных фраз), уровень отправителя (например, частота отправителя), и уровень получателя (вероятность получения безопасного сообщения), которые служат основой для создания высокоточных эвристических и модельных детекторов. Чтобы поддерживать систему детекции с постоянно высокой точностью, команда также внедряет инновации в программные системы и процессы, которые можно быстро адаптировать к решению краткосрочных тенденций и которые в долгосрочной перспективе хорошо обобщаются.

Эта позиция также предоставляет возможность оказать значительное влияние на общую хартию, направление и рост команды. Старший инженер по машинному обучению будет участвовать в изучении наиболее срочных проблем клиентов в области ложноположительных результатов и разработке связанной с этим технической дорожной карты для поддержания работы нашей системы детекции и принятия решений с очень высокой точностью.

Что вам предстоит делать

  • Проектировать и внедрять системы, которые интегрируют правила, модели, работу по выделению признаков, а также бизнесовые и продуктовые входные данные в продукт по обнаружению электронных писем.
  • Определить и рекомендовать новые группы признаков или подходы к ML-моделям, которые могут значительно улучшить эффективность обнаружения для продукта. Работать с инженерами инфраструктуры и систем для преобразования сигналов для поступления в систему обнаружения.
  • Понимать признаки, которые отличают безопасные электронные письма от атак, и как наша система детекторов позволяет их идентифицировать.
  • Стать экспертом в основных трубопроводах обнаружения и потоке данных решений для проведения отладки в систематических деградациях, вызванных слабыми детекторами.
  • Писать код, учитывая тестируемость, читаемость, граничные случаи и ошибки.
  • Обучать модели на определенных наборах данных, чтобы улучшить эффективность моделей на специализированных атаках.
  • Активно отслеживать и улучшать коеффициенты ложноположительных реакций и эффективность нашего продукта по обнаружению сообщений в категориях атак, через работу по выделению признаков, правила и ML-моделирование.
  • Анализировать наборы данных ложноотрицательных и ложноположительных результатов, чтобы классифицировать пробелы в возможностях и рекомендовать короткосрочные идеи признаков и правил для улучшения нашей эффективности обнаружения.
  • Вносить вклад в другие области стека, создавая и отлаживая конвейеры данных, или представляя результаты обратно клиентам в наших инструментах при необходимости.
  • Лидировать в средне- и долгосрочной дорожной карте команды и направлять стратегию планирования и выполнения для пода.
  • Наставлять и менторить младших инженеров для повышения их качества кода и эффективности ML посредством качественного код-ревью и обзора проектов.
  • Участвовать в создании мирового класса движка обнаружения на всех уровнях - качество данных, работа по выделению признаков, разработка моделей, проведение экспериментов и эксплуатация.

Основные требования

  • Подтвержденный опыт превращения бизнесовых требований в масштабируемые, обслуживаемые системы с направленностью на простые, итерационные системы.
  • Более 4 лет опыта работы с продуктовыми ML-системами - понимает основы современного ML-стека и процессы проектирования, обслуживания и настройки ML-моделей.
  • Способность систематически отлаживать как проблемы с данными, так и системные проблемы в моделях ML/эвристических моделях.
  • Владение Python и библиотеками машинного обучения, такими как numpy и scikit-learn.
  • Опыт работы с аналитикой данных и владение SQL+pandas+spark-фреймворком для создания конвейеров генерации данных и метрик, а также для ответа на критические вопросы об эффективности системы или контрфактуальных мерах.
  • История независимого управления всем жизненным циклом проектов или функций, включая инженерное проектирование, разработку и развертывание.
  • Опыт совместной работы с другими заинтересованными сторонами - работал с межфункциональными командами для завершения проектов.
  • Академическое образование в области машинного обучения (бакалавр компьютерных наук или смежных областей).

Желательно иметь

  • Степень магистра в области компьютерных наук, электротехники или другой смежной области технических наук.
  • Опыт работы с большими данными или статистикой.
  • Знакомство с индустрией кибербезопасности.

Это не:

  • Роль, сосредоточенная на оптимизации существующих моделей машинного обучения.
  • Направленная на исследования роль, дистанцирующаяся от продукта или клиента.
  • Совокупность статистики/науки о данных и роли ML.

 

#LI-ML1