Senior Software Engineer, Data

Job expired!

Про AssemblyAI

У компанії AssemblyAI ми є піонерами в галузі прикладного штучного інтелекту, розробляючи передові моделі для безперебійної транскрипції та розуміння аудіоданих через простий веб-API. Завдяки швидкому прогресу в технологіях штучного інтелекту, ми постійно слідкуємо за останніми науковими проривами, інтегруючи ці інновації в наші готові до виробництва моделі ШІ. Наша технологія автоматичного розпізнавання мови (ASR) перевершує світових лідерів, таких як Google, AWS та Microsoft, роблячи наш API кращим вибором для сотень компаній і тисяч розробників, які щодня транскрибують та аналізують мільйони відео, подкастів, телефонних дзвінків і зустрічей у Zoom.

Завдяки підтримці найкращих інвесторів, таких як Accel, Insight Partners, AI Fund від Y Combinator, Патрік і Джон Коллісон, Нат Фрідман та Даніель Гросс, AssemblyAI готова стати лідером на зростаючому ринку прикладного ШІ. Приєднуйтесь до нашої виняткової віддаленої команди та долучіться до створення видатної компанії в галузі ШІ!

Про роль: Старший інженер-програміст, дані

AssemblyAI шукає талановитого інженера-програміста для приєднання до команди Data Infrastructure. Ця позиція надає можливість визначати бачення, обсяг та структуру команди, а також впливати на архітектуру і можливості, які ви розробляєте. Кандидати повинні мати значний досвід у галузі Data Engineering, а також досвід у програмній інженерії, включаючи найкращі практики такі як стратегії тестування та код-рев'ю.

Оскільки це крос-функціональна роль, вона вимагає тісної співпраці з нашими командами досліджень і операцій із даними. Ідеальний кандидат повинен мати навички управління відносинами з різними зацікавленими сторонами та ефективно передавати складні ідеї різним аудиторіям.

Обов'язки

  • Розробка та підтримка платформ даних для нашої дослідницької команди, керування такими інструментами, як Airflow, BigQuery, Dataproc та Dataflow.
  • Проектування та реалізація високомасштабованих потоків даних на платформі розподілених обчислень з використанням Google Cloud Platform (GCP).
  • Внесення внеску в розвиток нашого мультимедійного AI Lakehouse.
  • Удосконалення нашої системи Data Lineage.
  • Створення внутрішніх інструментів, які допомагають іншим командам візуалізувати, використовувати та розуміти великі набори даних.
  • Реалізація захисних заходів для оптимізації вартості, якості даних, зручності використання та швидкості.

Вимоги

  • 5+ років професійного досвіду в програмній інженерії, демонструючи чистий, підтримуваний та добре протестований код.
  • 3+ роки досвіду в якості Data Engineer або на схожій посаді.
  • Професіоналізм у роботі з BigTable, BigQuery, Dataproc, Dataflow, Dataplex та Cloud Composer серед інших сервісів GCP.
  • Знайомство з розподіленими фреймворками обробки даних, такими як Apache Beam та Apache Spark, з глибоким розумінням як