O roli
Abnormal Security poszukuje doświadczonego inżyniera z dziedziny Machine Learning do zespołu Message Detection Decisioning. W Abnormal dążymy do ochrony naszych klientów przed złośliwymi przeciwnikami, którzy nieustannie udoskonalają swoje strategie i techniki, aby przechytrzyć i podkopać standardowe procedury bezpieczeństwa. To właśnie sprawia, że nasza oryginalna strategia oparta na zachowaniach jest tak... Abnormalna. Abnormal stale jest rankinguje wśród najlepszych startupów z dziedziny cyberbezpieczeństwa, a nasz system AI pomógł nam zdobyć różne nagrody z tej dziedziny, co zaowocowało powierzeniem nam ochrony ponad 8% z Fortune 1000 (i ciągłym wzrostem).
W środowisku, w którym pojedynczy udany atak może prowadzić do finansowych strat wynoszących miliony dolarów, zespół Message Detection Decisioning odgrywa kluczową rolę w tworzeniu silnika detekcji o wysokiej precyzji, zdolnego do przetwarzania setek milionów wiadomości w milisekundowych opóźnieniach. Wszystkie e-maile przetwarzane przez Abnormal przechodzą przez proces zarządzany przez zespół Detection Decisioning, który stosuje setki sygnałów i detektorów do wiadomości, w zależności od kontekstu wiadomości i użytkownika. System następnie oblicza ostateczną decyzję dla systemu, a następnie rejestruje przypisanie, aby kierować różne metryki offline i online, takie jak precyzja offline, precyzja online, współczynnik fałszywie negatywnych wyników i tak dalej.
Zespół zmagają się z wielowarstwowym problemem detekcji, który polega na modelowaniu wzorców komunikacji w celu ustalenia bazowych poziomów w całym przedsiębiorstwie. Integracja tych wzorców jako solidne sygnały i połączenie ich z informacjami kontekstowymi prowadzi do stworzenia systemów o wysokiej precyzji. Zespół tworzy dyskryminujące sygnały na różnych poziomach, w tym na poziomie wiadomości (na przykład obecność określonych fraz), na poziomie nadawcy (na przykład częstotliwość nadawcy) i na poziomie odbiorcy (na przykład prawdopodobieństwo otrzymania bezpiecznej wiadomości), które służą jako podstawa dla tworzenia bardzo precyzyjnych detektorów opartych na regułach i modelach. Aby utrzymać system detekcji o stabilnie wysokiej precyzji, zespół wprowadza również innowacje w systemach i procesach oprogramowania, które można szybko dostosować do rozwiązania krótkoterminowych trendów i które dobrze generalizują w długim okresie.
To stanowisko oferuje również możliwość znaczącego wpływu na ogólny statut, kierunek i rozwój zespołu. Starszy inżynier Machine Learning będzie zaangażowany w zrozumienie najpilniejszych problemów klienta w dziedzinie fałszywie pozytywnych wyników i budowanie związanego z tym planu technicznego, aby nasz system detekcji działał z ekstremalnie wysoką precyzją.
Co będziesz robił
- Projektować i wprowadzać do eksploatacji systemy, które integrują reguły, modele, inżynierię cech, oraz wejścia biznesowe i produktowe w produkt detekcji e-maili.
- Identyfikować i rekomendować nowe grupy cech lub podejścia do modeli ML, które mogą znacznie poprawić skuteczność detekcji dla produktu. Współpracować z inżynierami infrastruktury i systemów w celu przekształcenia sygnałów do użycia przez system detekcji.
- Zrozumieć cechy, które odróżniają bezpieczne e-maile od ataków e-mailowych i jak nasz system detektorów pozwala nam je identyfikować.
- Zostać ekspertem w głównych przepływach detekcji i sterowania danymi decyzji, aby napędzać debugowanie systematycznych degradacji wywołanych przez kiepskie detektory.
- Pisać kod, zwracając uwagę na testowalność, czytelność, przypadki brzegowe i błędy.
- Trenować modele na określonych zestawach danych, aby zwiększyć skuteczność modelu na specjalistycznych atakach.
- Proaktywnie monitorować i poprawiać współczynniki fałszywie pozytywnych i skuteczności dla naszych kategorii ataków w produkcie detekcji wiadomości, poprzez inżynierię cech, reguły i modelowanie ML.
- Analizować zestawy danych fałszywie negatywnych i pozytywnych, aby kategoryzować luki w zdolnościach i zarekomendować krótkoterminowe pomysły na cechy i reguły, które podniosą skuteczność naszej detekcji.
- Przyczyniać się do innych obszarów stosu, tworząc i debugując przepływy danych lub prezentując wyniki klientom za pomocą naszych narzędzi, gdy to konieczne.
- Zapewniać kierunek średnioterminowej i długoterminowej drogi rozwoju zespołu i sterować strategią planowania i realizacji dla danej grupy.
- Coachingować i mentorować młodszych inżynierów, aby podnieść jakość ich kodu i skuteczność ML poprzez jakościowe przeglądy kodu i przeglądy projektu.
- Uczestniczyć w tworzeniu silnika detekcji na miarę świata na wszystkich poziomach - jakość danych, inżynieria cech, rozwój modeli, eksperymenty i operacje.
Wymagania
- Udokumentowane doświadczenie w przekładaniu wymagań biznesowych na skalowalne, utrzymywalne systemy o skłonności do prostszych, iteracyjnych systemów.
- 4+ lat doświadczenia z systemami ML - rozumie filary współczesnej technologii ML i procesy projektowania, konserwacji i strojenia modelów ML.
- Zdolność do systematycznego debugowania zarówno problemów z danymi, jak i systemowymi w modelach ML/heurystycznych.
- Znajomość Pythona i bibliotek do uczenia maszynowego, takich jak numpy i scikit-learn.
- Doświadczenie z analityką danych i umiejętność korzystania z ramy SQL+pandas+spark do tworzenia przepływów danych i generacji metryk, oraz do rozwiązania kluczowych kwestii dotyczących skuteczności systemu lub przeciwdziałania.
- Doświadczenie samodzielnego zarządzania całym cyklem życia projektów lub zadań, łącznie z projektem technicznym, rozwojem i wdrożeniem.
- Doświadczenie w pracy z innymi zainteresowanymi stronami - praca z zespołami wielofunkcyjnymi na rzecz realizacji projektów.
- Wykształcenie akademickie w zakresie uczenia maszynowego (licencjackie studia informatyczne lub w pokrewnych dziedzinach).
Fajnie, jeśli nie brakuje Ci
- Studia magisterskie z dziedziny informatyki, elektrotechniki lub innej pokrewnej dziedziny inżynierii
- Doświadczenie z dużymi danymi lub statystyką
- Znajomość branży cyberbezpieczeństwa
Na tym stanowisku nie znajdziesz:
- Roli skoncentrowanej na optymalizacji istniejących modeli uczenia maszynowego
- Roli skoncentrowanej na badaniach, która jest oddalona od produktu lub klienta
- Połączenia roli statystyki/nauki o danych i roli ML
#LI-ML1