Główny Inżynier Danych AI

  • Full Time
Job expired!
To jest hybrydowa rola z siedzibą w naszych biurach w Palo Alto lub San Francisco, która wymaga od Ciebie obecności w biurze we wtorki i czwartki. Czym ciekawi jest ta rola? W Grindr wierzymy, że AI może zrewolucjonizować branżę randkową. Nasz kierownik Działu Inżynierii Danych jest odpowiedzialny za tworzenie wysokiej jakości datasetów ML na dużą skalę, wykorzystywanych do trenowania modeli ML, które zasilają funkcje oparte na AI. W tej kluczowej roli będziesz miał możliwość budowania podstawowych narzędzi i data pipelines do pozyskiwania, normalizacji i czyszczenia cennych danych, które będą podstawą dla naszych inżynierów ML w Grindr do budowy narzędzi AI, w tym rekomendacji, LLM, reklam, wyszukiwania wizualnego, wzrostu/powiadomień, zaufania i bezpieczeństwa. Czym będzie Twoja praca? Szukamy wyjątkowego inżyniera danych, który pasjonuje się danymi dla AI i docenia ich wartość, którą mogą przynieść Grindr, kto kocha pracować z danymi na dużą skalę; i kto jest zaangażowany w ciężką pracę niezbędną do ciągłego doskonalenia naszych data pipelines dla ML. Na tym stanowisku będziesz odpowiedzialny za ustalanie strategii i jej realizację dla naszego ML Data Engine, ze wstępnym naciskiem na zwinne ML Data OPs. Obejmuje to identyfikację komponentów infrastruktury i stosu danych do użycia, projektowanie i implementację pipelines między systemami danych i zespołami, automatyzację prac, wzbogacanie danych i narzędzia monitorowania - wszystko dla modeli AI. Jako tech lead specjalizujący się w inżynierii danych, oczekuje się od Ciebie kodowania i wprowadzania wkładu do stosu. Obowiązki: - Zanurzyć się w naszym zasobie danych i zaprojektować, zaimplementować i skalować data pipelines przed/po procesowaniu modeli ML - Pracować nad zastosowaniami ML w obszarach wydobycia danych, czyszczenia, normalizacji i modelowania - Być samozmotywowanym w poszukiwaniu rozwiązań, gdy właściwa droga nie zawsze jest znana - Współpracować z inżynierami w koncepcji, planowaniu i implementacji inicjatyw inżynierii danych, pracując z różnymi interesariuszami - Projektować i tworzyć platformy danych i ramy do przetwarzania dużych ilości danych, w czasie rzeczywistym, jak również w trybie batch, które będą używane przez zespoły inżynieryjne - Budować strumienie przetwarzania danych do czyszczenia i modelowania danych tekstowych dla LLM - Badanie i ocena nowych technologii w przestrzeni big data, aby kierować nasze ciągłe doskonalenie - Współpracować z wielofunkcyjnymi zespołami, aby pomóc w dostrojeniu wydajności dużych aplikacji danych - Pracować z zespołem ds. Prywatności i Bezpieczeństwa nad inicjatywami związanymi z zarządzaniem ryzykiem, zgodnością i danymi - Pracować nad inicjatywami mającymi na celu zapewnienie stabilności, wydajności i niezawodności naszej infrastruktury danych Co pokochamy w Tobie: - Licencjat z Informatyki, Matematyki, Fizyki lub pokrewnej dziedziny - 5+ lat doświadczenia jako inżynier danych budujący produkcyjne data pipelines dla modeli ML/DL, w tym 2+ lat doświadczenia na stanowisku lidera technicznego - Doświadczenie w analizie statystycznej i wizualizacji danych za pomocą Pandas lub R - Doświadczenie w projektowaniu i budowaniu wysoko dostępnych, rozproszonych systemów ekstrakcji, pobierania, normalizacji i przetwarzania dużych zbiorów danych w czasie rzeczywistym, jak również w trybie batch, które będą używane przez zespoły inżynieryjne za pomocą ram orchestracyjnych takich jak Airflow, KubeFlow lub inne narzędzia do tworzenia data pipelines - Udowodnione wcześniejsze doświadczenie w tworzeniu data pipelines dla zbiorów danych tekstowych NLP/ duże modele językowe - Umiejętność tworzenia dobrze wykonanego oprogramowania, w tym odpowiednie zautomatyzowane zestawy testów, dokumentację techniczną i strategię operacyjną - Doskonałe umiejętności kodowania w Python, Java, bash, SQL, oraz zaawansowane umiejętności z Git - Doświadczenie w korzystaniu z technologii big data (Snowflake, Airflow, Kubernetes, Docker, Helm, Spark, pySpark) - Doświadczenie z dowolnym środowiskiem chmurowym - AWS, GCP lub Azure - Znaczne doświadczenie z bazami danych relacyjnymi i tworzeniem zapytań (SQL) oraz z bazami danych NoSQL takimi jak DynamoDB itp. - Doświadczenie w budowaniu i utrzymaniu ETL (zarządzanie wysokiej jakości niezawodnymi ETL pipelines) Będziemy naprawdę zafascynowani, jeśli posiadasz: - 2+ lata doświadczenia na stanowisku lidera technicznego w budowaniu data engineering pipelines dla AI - Wcześniejsze doświadczenie w budowaniu data pipelines dla konwersacyjnych API AI i systemów rekomendacyjnych - Doświadczenie z rozproszonymi systemami i mikrousługami - Doświadczenie z Kubernetes i tworzeniem obrazów Docker - Doświadczenie w budowaniu systemów przetwarzania strumieniowego, wykorzystując takie rozwiązania jak Kafka, Storm lub Spark-Streaming - Silne zrozumienie zastosowań uczenia maszynowego - Znajomość kwestii zgodności prawnej (z narzędziami zarządzania danymi) klasyfikacji danych i retencji - Stała ścieżka kariery zarządzania i implementacji skomplikowanych projektów związanych z danymi Co pokochasz u nas - Misja i wpływ: Grindr to wiodąca na świecie usługa społecznościowa dla osób LGBTQ. Twoja rola wpłynie na życie milionów osób LGBTQ na całym świecie - Wiele lokalizacji: Szukamy kogoś na to stanowisko z preferowaną lokalizacją w San Francisco lub Palo Alto - Ubezpieczenie rodzinne: Pokrycie składek na ubezpieczenie zdrowotne, stomatologiczne i na okulary dla Ciebie oraz częściowe dla Twoich osób na utrzymaniu - Oszczędności na emeryturę: Hojny plan 401K z dopasowaniem 6% i natychmiastowym wejściem w USA - Wynagrodzenie: Wynagrodzenie zgodne ze standardami branży i możliwość uczestnictwa w programach bonusowych i akcyjnych firmy - Queer-Inclusive Benefits: Wiodące w branży oferty afirmujące płeć z pokryciem do 90% kosztów, dostęp do Included Health, miesięczne stypendia na HRT i wiele innych - Dodatkowe korzyści: Elastyczna polityka urlopu, miesięczne stypendia na telefon komórkowy, internet, wellness i jedzenie, jednorazowe stypendium na wyposażenie biura domowego i firmowe imprezy O Grindr: Grindr to największa na świecie aplikacja randkowa dla gejów, bi, osób trans i queer. Z około 13 milionami aktywnych użytkowników miesięcznie, Grindr stał się fundamentalną częścią globalnej społeczności LGBTQ, a my jesteśmy dumni, że umożliwiamy naszym użytkownikom łączenie się, wyrażanie siebie i odkrywanie queerowego świata wokół nich. Nasza kolejna ewolucja jest w toku jako nowo publiczna firma, która chce się rozwijać i dalej budować znaczące doświadczenia dla naszych użytkowników. Od kwestii społecznych po oryginalne treści, przebijamy się innowacyjnymi ścieżkami z wpływem na naszą społeczność, korzystając przy tym z najnowszych technologii i dążąc do doskonałości inżynieryjnej. W centrum naszej pracy w tym nowym rozdziale są wspólne wartości: otwartość i odkrywanie, skłonność do działania i silne wsparcie dla społeczności LGBTQ. Z historią silnej wydajności finansowej i planami dalszego wzrostu liczby pracowników, chcemy zbudować zespół utalentowanych, pełnych pasji, otwartych umysłów, które wierzą w naszą misję, zgodne z naszymi wartościami i są podekscytowane pracą na skrzyżowaniu innowacyjnej technologii i wpływu społecznego. Dołącz do nas w tej ekscytującej podróży. Grindr to pracodawca zapewniający równość szans Aby dowiedzieć się więcej o tym, jak przetwarzamy dane osobowe kandydatów, odwiedź naszą Politykę Prywatności Pracowników i Kandydatów. #LI-Hybrid