О роли
Компания Abnormal Security ищет старшего инженера по машинному обучению, который станет частью команды Детекции и Принятия Решений о Сообщениях. В компании Abnormal мы стремимся защищать наших клиентов от злонамеренных участников, которые постоянно улучшают свои стратегии и техники, чтобы перехитрить и подрезать обычные процедуры безопасности. Именно поэтому наша оригинальная стратегия, основанная на поведении, так... необычна. Abnormal постоянно входит в список лучших стартапов в области кибербезопасности, а наша система искусственного интеллекта помогла нам получить различные премии в области кибербезопасности, благодаря чему нам доверяют охрану более 8% компаний из списка Fortune 1000 (и количество продолжает расти).
В условиях, когда одна успешная атака может привести к финансовым убыткам в миллионы долларов, команда Детекции и Принятия Решений о Сообщениях играет центральную роль в разработке высокоточного Движка Детекции, способного функционировать с сотнями миллионов сообщений с миллисекундной задержкой. Все письма, обрабатываемые Abnormal, проходят через рабочий процесс, управляемый этой командой, которая применяет сотни сигналов и детекторов к сообщению, в зависимости от контекста сообщения и пользователя. Затем система вычисляет итоговое общее решение для системы и затем регистрирует атрибуцию для управления различными офлайн и онлайн метриками, такими как офлайн точность, онлайн точность, онлайн коеффициент ложноотрицательных результатов и так далее.
Команда решает многослойную задачу детекции, которая включает моделирование образцов коммуникации для установления базовых линий по всему предприятию. Включая эти образцы как надежные сигналы и объединяя их с контекстуальной информацией, они создают системы с высокой точностью. Команда создает дискриминационные сигналы на разных уровнях, включая уровень сообщения (например, наличие определенных фраз), уровень отправителя (например, частота отправителя), и уровень получателя (вероятность получения безопасного сообщения), которые служат основой для создания высокоточных эвристических и модельных детекторов. Чтобы поддерживать систему детекции с постоянно высокой точностью, команда также внедряет инновации в программные системы и процессы, которые можно быстро адаптировать к решению краткосрочных тенденций и которые в долгосрочной перспективе хорошо обобщаются.
Эта позиция также предоставляет возможность оказать значительное влияние на общую хартию, направление и рост команды. Старший инженер по машинному обучению будет участвовать в изучении наиболее срочных проблем клиентов в области ложноположительных результатов и разработке связанной с этим технической дорожной карты для поддержания работы нашей системы детекции и принятия решений с очень высокой точностью.
Что вам предстоит делать
- Проектировать и внедрять системы, которые интегрируют правила, модели, работу по выделению признаков, а также бизнесовые и продуктовые входные данные в продукт по обнаружению электронных писем.
- Определить и рекомендовать новые группы признаков или подходы к ML-моделям, которые могут значительно улучшить эффективность обнаружения для продукта. Работать с инженерами инфраструктуры и систем для преобразования сигналов для поступления в систему обнаружения.
- Понимать признаки, которые отличают безопасные электронные письма от атак, и как наша система детекторов позволяет их идентифицировать.
- Стать экспертом в основных трубопроводах обнаружения и потоке данных решений для проведения отладки в систематических деградациях, вызванных слабыми детекторами.
- Писать код, учитывая тестируемость, читаемость, граничные случаи и ошибки.
- Обучать модели на определенных наборах данных, чтобы улучшить эффективность моделей на специализированных атаках.
- Активно отслеживать и улучшать коеффициенты ложноположительных реакций и эффективность нашего продукта по обнаружению сообщений в категориях атак, через работу по выделению признаков, правила и ML-моделирование.
- Анализировать наборы данных ложноотрицательных и ложноположительных результатов, чтобы классифицировать пробелы в возможностях и рекомендовать короткосрочные идеи признаков и правил для улучшения нашей эффективности обнаружения.
- Вносить вклад в другие области стека, создавая и отлаживая конвейеры данных, или представляя результаты обратно клиентам в наших инструментах при необходимости.
- Лидировать в средне- и долгосрочной дорожной карте команды и направлять стратегию планирования и выполнения для пода.
- Наставлять и менторить младших инженеров для повышения их качества кода и эффективности ML посредством качественного код-ревью и обзора проектов.
- Участвовать в создании мирового класса движка обнаружения на всех уровнях - качество данных, работа по выделению признаков, разработка моделей, проведение экспериментов и эксплуатация.
Основные требования
- Подтвержденный опыт превращения бизнесовых требований в масштабируемые, обслуживаемые системы с направленностью на простые, итерационные системы.
- Более 4 лет опыта работы с продуктовыми ML-системами - понимает основы современного ML-стека и процессы проектирования, обслуживания и настройки ML-моделей.
- Способность систематически отлаживать как проблемы с данными, так и системные проблемы в моделях ML/эвристических моделях.
- Владение Python и библиотеками машинного обучения, такими как numpy и scikit-learn.
- Опыт работы с аналитикой данных и владение SQL+pandas+spark-фреймворком для создания конвейеров генерации данных и метрик, а также для ответа на критические вопросы об эффективности системы или контрфактуальных мерах.
- История независимого управления всем жизненным циклом проектов или функций, включая инженерное проектирование, разработку и развертывание.
- Опыт совместной работы с другими заинтересованными сторонами - работал с межфункциональными командами для завершения проектов.
- Академическое образование в области машинного обучения (бакалавр компьютерных наук или смежных областей).
Желательно иметь
- Степень магистра в области компьютерных наук, электротехники или другой смежной области технических наук.
- Опыт работы с большими данными или статистикой.
- Знакомство с индустрией кибербезопасности.
Это не:
- Роль, сосредоточенная на оптимизации существующих моделей машинного обучения.
- Направленная на исследования роль, дистанцирующаяся от продукта или клиента.
- Совокупность статистики/науки о данных и роли ML.
#LI-ML1