Senior Software Engineer, Data

Job expired!

О компании AssemblyAI

В AssemblyAI мы занимаемся новаторством в области прикладного ИИ, разрабатывая передовые модели для распознавания и понимания аудиоданных через простой веб-API. С быстрым развитием технологий ИИ мы постоянно следим за последними научными достижениями, интегрируя эти новшества в наши готовые к производству модели ИИ. Наша технология автоматического распознавания речи (ASR) превосходит таких лидеров отрасли, как Google, AWS и Microsoft, делая наш API предпочтительным выбором для сотен компаний и тысяч разработчиков, которые ежедневно транскрибируют и анализируют миллионы видео, подкастов, телефонных звонков и встреч в Zoom.

Поддерживаемые ведущими инвесторами, такими как Accel, Insight Partners, фонд ИИ Y Combinator, Патрик и Джон Коллисон, Нэт Фридман и Дэниел Гросс, AssemblyAI стремится стать лидером на быстрорастущем рынке прикладного ИИ. Присоединяйтесь к нашей исключительной удаленной команде и вносите свой вклад в создание знаковой компании ИИ!

О роли: Старший инженер-программист, данные

AssemblyAI ищет талантливого инженера-программиста для присоединения к нашей команде инфраструктуры данных. Эта позиция предоставляет возможность формировать видение, объем и структуру команды и влиять на архитектуру и возможности, которые вы создаете. Кандидаты должны иметь крепкий опыт в области инженерии данных в сочетании с опытом в программной инженерии, включая лучшие практики, такие как стратегии тестирования и ревизии кода.

Поскольку это кросс-функциональная роль, она требует тесного сотрудничества с нашими командами исследований и операций с данными. Идеальный кандидат должен уметь управлять отношениями с различными заинтересованными сторонами и эффективно доносить сложные идеи до разной аудитории.

Обязанности

  • Разработка и поддержка платформ данных для нашей исследовательской команды, управление инструментами, такими как Airflow, BigQuery, Dataproc и Dataflow.
  • Проектирование и реализация масштабируемых конвейеров данных на распределенных вычислительных платформах с использованием Google Cloud Platform (GCP).
  • Содействие развитию нашего мультимедийного ИИ-озера данных.
  • Улучшение нашей системы родословной данных.
  • Создание внутренних инструментов, помогающих другим командам визуализировать, использовать и понимать большие наборы данных.
  • Реализация ограничений для оптимизации затрат, качества данных, удобства использования и скорости.

Требования

  • Более 5 лет профессионального опыта в программной инженерии, демонстрирующего чистый, поддерживаемый и хорошо протестированный код.
  • Более 3 лет опыта работы инженером данных или на аналогичной позиции.
  • Опыт работы с BigTable, BigQuery, Dataproc, Dataflow, Dataplex и Cloud Composer среди других сервисов GCP.
  • Знакомство с распределенными системами обработки данных, такими как Apache Beam и Apache Spark, с глубоким пониманием как пакетной, так и потоковой обработки.
  • Опыт работы с инструментами автоматизации рабочих процессов, такими как Airflow или управляемыми решениями, такими как Composer и Astronomer.
  • Свободное владение Python и SQL.
  • Опыт создания внутренних приложений и инструментов для разработчиков или исследователей.
  • Подтверждённый опыт работы с системами родословной данных.
  • Практический опыт работы с Terraform, Docker, Kubernetes и CI/CD.
  • Знание паттернов и лучших практик GCP IAM.
  • Опыт работы с Mage или Prefect является плюсом.

Прозрачность оплаты труда

В AssemblyAI мы стремимся привлекать и удерживать выдающихся специалистов из самых разных слоев общества, придерживаясь принципа равенства оплаты труда. Наши диапазоны зарплат разработаны таким образом, чтобы