Senior Software Engineer, Data

Job expired!

O AssemblyAI

W AssemblyAI jesteśmy pionierami w dziedzinie stosowanej sztucznej inteligencji, opracowując zaawansowane modele do transkrypcji i rozumienia danych audio za pomocą prostego API sieciowego. Z uwagi na szybki rozwój technologii AI, nieustannie śledzimy najnowsze osiągnięcia w badaniach, integrując te innowacje z naszymi gotowymi do produkcji modelami sztucznej inteligencji. Nasza technologia automatycznego rozpoznawania mowy (ASR) przewyższa liderów branży takich jak Google, AWS i Microsoft, dzięki czemu nasze API jest preferowanym wyborem dla setek firm i tysięcy deweloperów, którzy codziennie transkrybują i analizują miliony filmów, podcastów, rozmów telefonicznych i spotkań na Zoomie.

Dzięki wsparciu czołowych inwestorów takich jak Accel, Insight Partners, Y Combinator’s AI Fund, Patrick i John Collision, Nat Friedman oraz Daniel Gross, AssemblyAI jest na dobrej drodze, aby stać się liderem na szybko rozwijającym się rynku stosowanej sztucznej inteligencji. Dołącz do naszego wyjątkowego zespołu zdalnych pracowników i przyczyń się do budowy wyjątkowej firmy AI!

Opis stanowiska: Starszy Inżynier Oprogramowania, Dane

AssemblyAI poszukuje utalentowanego Inżyniera Oprogramowania, który dołączy do naszego zespołu Infrastruktur Danych. Ta pozycja oferuje możliwość kształtowania wizji, zakresu i struktury zespołu oraz wpływania na architekturę i funkcjonalności, które budujesz. Kandydaci powinni mieć solidne doświadczenie w inżynierii danych połączone z doświadczeniem w inżynierii oprogramowania, w tym najlepsze praktyki takie jak strategie testowania i przeglądy kodu.

Z uwagi na to, że jest to rola międzyfunkcyjna, wymaga ona ścisłej współpracy z naszymi zespołami badawczymi i operacjami danych. Idealny kandydat powinien być biegły w zarządzaniu relacjami z różnymi interesariuszami i efektywnym komunikowaniu złożonych pomysłów różnym odbiorcom.

Obowiązki

  • Rozwijanie i utrzymywanie platform danych dla naszego zespołu badawczego, zarządzanie narzędziami takimi jak Airflow, BigQuery, Dataproc i Dataflow.
  • Projektowanie i wdrażanie wysoce skalowalnych potoków danych na rozproszonych platformach obliczeniowych z użyciem Google Cloud Platform (GCP).
  • Współudział w rozwoju naszego multimedialnego magazynu danych AI.
  • Udoskonalanie naszego systemu śledzenia danych.
  • Tworzenie wewnętrznych narzędzi, które pomagają innym zespołom wizualizować, używać i rozumieć duże zbiory danych.
  • Wdrażanie zabezpieczeń optymalizujących koszty, jakość danych, użyteczność i szybkość.

Wymagania

  • 5+ lat doświadczenia zawodowego w inżynierii oprogramowania, demonstrującego czysty, utrzymywalny i dobrze przetestowany kod.
  • 3+ lata doświadczenia jako inżynier danych lub na podobnym stanowisku.
  • Biegłość z BigTable, BigQuery, Dataproc, Dataflow, Dataplex i Cloud Composer oraz innymi usługami GCP.
  • Znajomość rozproszonych frameworków przetwarzania danych, takich jak Apache Beam i Apache Spark, z głębokim zrozumieniem zarówno przetwarzania wsadowego, jak i strumieniowego.
  • Doświadczenie z narzędziami automatyzacji przepływu pracy, takimi jak Airflow lub zarządzane rozwiązania, jak Composer i Astronomer.
  • Zaawansowane umiejętności w