À propos du poste
Abnormal Security recherche un Ingénieur en apprentissage automatique senior pour rejoindre l'équipe de détection et de décision des messages. Chez Abnormal, nous protégeons nos clients contre des adversaires malveillants qui ne cessent d'évoluer leurs techniques et tactiques pour déjouer et miner les approches traditionnelles de la sécurité. C'est ce qui rend notre approche basée sur le comportement si...Abnormal. Abnormal est constamment cité comme l'un des meilleurs start-ups en cybersécurité et notre système d'IA comportemental nous a aidé à gagner divers prix de cybersécurité, nous permettant d'être reconnus pour la protection de plus de 8% des entreprises du Fortune 1000 (et la liste ne cesse de s'allonger).
Dans un contexte où une seule attaque réussie peut entraîner des pertes financières de millions de dollars, l'équipe de détection et de décision des messages joue un rôle central dans la construction d'un moteur de détection extrêmement précis, capable de fonctionner sur des centaines de millions de messages avec une latence de millisecondes. Chaque courrier électronique ingéré par Abnormal passe par le workflow géré par l'équipe de détection et de décision, qui applique des centaines de signaux et de détecteurs sur un message en fonction du contexte du message et de l'utilisateur. Le système calcule ensuite la décision finale globale pour le système et consigne en conséquence l'attribution pour alimenter diverses mesures en ligne et hors ligne telles que la précision hors ligne, la précision en ligne, le taux de faux négatifs en ligne, etc.
Cette équipe résout un problème de détection multicouche, qui implique de modéliser les schémas de communication pour établir des bases de référence à l'échelle de l'entreprise, d'incorporer ces schémas comme signaux robustes et de combiner ces signaux avec des informations contextuelles pour créer des systèmes de haute précision. L'équipe construit des signaux discriminatoires à divers niveaux, y compris au niveau du message (par exemple, présence de phrases particulières), au niveau de l'expéditeur (par exemple, fréquence de l'expéditeur) et au niveau du destinataire (par exemple, probabilité de recevoir un message sûr), ce qui forme la base de la création de détecteurs heuristiques et fondés sur des modèles très précis. De plus, pour maintenir un système de détection de haute précision, l'équipe innove sur les systèmes logiciels et les processus qui peuvent être rapidement adaptés pour résoudre les tendances observées à court terme tout en se généralisant bien à long terme.
Ce rôle offre également l'opportunité d'avoir un impact énorme sur la charte globale, la direction et la croissance de l'équipe. L'Ingénieur en apprentissage automatique senior serait impliqué dans la compréhension des problèmes les plus urgents des clients dans le domaine des faux positifs et établirait la feuille de route technique associée pour faire fonctionner en permanence notre système de décision de détection avec une précision extrêmement élevée.
Ce que vous ferez
- Concevoir et mettre en œuvre des systèmes qui combinent des règles, des modèles, de l’ingénierie de fonctionnalités, et des informations d’affaires et de produits dans un produit de détection de courriels.
- Identifier et recommander de nouvelles fonctionnalités ou approches de modèles d'apprentissage automatique qui peuvent améliorer de manière significative l'efficacité de la détection pour un produit. Collaborer avec les ingénieurs de l'infrastructure et des systèmes pour intégrer les signaux dans le système de détection.
- Comprendre les caractéristiques qui distinguent les courriels sûrs des attaques par courrier électronique et comment notre pile de détecteurs nous permet de les détecter.
- Être l'expert des pipelines de détection principaux et du flux de données de décision pour pouvoir piloter le débogage des dégradations systématiques causées par de mauvais détecteurs.
- Écrit du code en tenant compte de la testabilité, de la lisibilité, des cas limites et des erreurs.
- Entraîner des modèles sur des ensembles de données bien définis pour améliorer l'efficacité du modèle sur des attaques spécialisées.
- Surveiller et améliorer activement les taux de faux positifs et
d'efficacité pour nos catégories d'attaque de produit de détection de messages, grâce à l'ingénierie des fonctionnalités, aux règles et à la modélisation en apprentissage automatique.
- Analyser les ensembles de données de faux négatifs et de faux positifs pour catégoriser les lacunes en matière de capacités et recommander des idées de caractéristiques et de règles à court terme pour améliorer notre efficacité de détection.
- Contribuer à d'autres domaines de la pile: construire et déboguer des pipelines de données, ou présenter les résultats aux clients dans nos outils lorsque l'occasion se présente.
- Diriger la feuille de route à moyen et long terme de l'équipe et mener la stratégie de planification et d'exécution pour le pod.
- Coach et mentor pour les ingénieurs juniors pour améliorer la qualité de leur code et l'efficacité de leur apprentissage automatique en fournissant des revues de code et de conception de qualité.
- Participer à la construction d'un moteur de détection de classe mondiale à tous les niveaux - qualité des données, ingénierie des fonctionnalités, développement du modèle, expérimentation et opération.
Essentiel
- Expérience avérée de réussite dans la traduction des exigences commerciales en systèmes évolutifs et maintenables, avec une préférence vers des systèmes plus simples mais itératifs.
- 4+ Expérience avec des systèmes d'apprentissage automatique en production - comprend les piliers d'une pile moderne d'apprentissage automatique et les processus de développement, de maintenance et d'ajustement des modèles d'apprentissage automatique.
- Utilise une approche systématique pour déboguer à la fois les données et les problèmes de système au sein des modèles ML / heuristiques.
- Aisance avec Python et les bibliothèques d'apprentissage automatique comme numpy et scikit-learn.
- Expérience avec l'analyse de données et la maîtrise du framework SQL+pandas+spark pour construire à la fois des pipelines de génération de données et de metrics, et répondre à des questions critiques sur l'efficacité du système ou les traitements contrefactuels.
- Responsable indépendamment de l'ensemble du cycle de vie des projets ou des fonctionnalités, y compris la conception, le développement et le déploiement.
- Travaille bien avec d'autres parties prenantes - a travaillé avec des équipes plurifonctionnelles pour mener à bien des projets.
- Formation académique en apprentissage automatique (Bachelor en informatique ou domaines connexes).
Serait un plus
- Master en informatique, en génie électrique ou dans un autre domaine d'ingénierie connexe
- Expérience avec les données massives ou la statistique
- Familiarité avec l'industrie de la cybersécurité
Ce poste n'est pas:
- Un poste axé sur l'optimisation des modèles d'apprentissage automatique existants
- Un poste de recherche qui est deux fois éloigné du produit ou du client
- Un poste de science des données/stats rencontre l'apprentissage automatique
#LI-ML1