Senior Software Engineer, Data

Job expired!

À propos d'AssemblyAI

Chez AssemblyAI, nous innovons dans le domaine de l'IA appliquée en développant des modèles avancés pour transcrire et comprendre les données audio de manière transparente via une API web simple. Avec les avancées rapides de la technologie IA, nous restons constamment à l'écoute des dernières découvertes en recherche, intégrant ces innovations dans nos modèles d'IA prêts pour la production. Notre technologie de reconnaissance automatique de la parole (ASR) dépasse les leaders de l'industrie comme Google, AWS et Microsoft, faisant de notre API un choix privilégié pour des centaines d'entreprises et des milliers de développeurs qui transcrivent et analysent des millions de vidéos, podcasts, appels téléphoniques et réunions Zoom quotidiennement.

Soutenu par des investisseurs de premier plan tels qu'Accel, Insight Partners, le AI Fund de Y Combinator, Patrick et John Collison, Nat Friedman et Daniel Gross, AssemblyAI est bien positionné pour devenir un leader sur le marché en plein essor de l'IA appliquée. Rejoignez notre équipe exceptionnelle en télétravail et contribuez à bâtir une entreprise IA de référence !

À propos du rôle : Ingénieur logiciel senior, Data

AssemblyAI recherche un ingénieur logiciel talentueux pour rejoindre notre équipe Infrastructure de données. Ce poste offre l'opportunité de définir la vision, l'étendue et la structure de l'équipe et d'influencer l'architecture et les capacités que vous construisez. Les candidats doivent avoir une solide expérience en ingénierie des données, ainsi qu'une expérience en ingénierie logicielle, y compris les meilleures pratiques telles que les stratégies de test et les revues de code.

Étant donné qu'il s'agit d'un rôle transversal, il nécessite une collaboration étroite avec nos équipes Recherche et Opérations de données. Le candidat idéal doit être capable de gérer les relations avec différents intervenants et de communiquer efficacement des idées complexes à des publics variés.

Responsabilités

  • Développer et maintenir des plateformes de données pour notre équipe de recherche, en gérant des outils comme Airflow, BigQuery, Dataproc et Dataflow.
  • Concevoir et implémenter des pipelines de données hautement évolutifs sur des plateformes de calcul distribué utilisant Google Cloud Platform (GCP).
  • Contribuer au développement de notre Lakehouse AI multimédia.
  • Améliorer notre système de traçabilité des données.
  • Créer des outils internes pour aider les autres équipes à visualiser, utiliser et comprendre de grands ensembles de données.
  • Mettre en place des garde-fous pour optimiser les coûts, la qualité des données, l'utilisabilité et la vitesse.

Exigences

  • 5+ années d'expérience professionnelle en ingénierie logicielle, démontrant un code propre, maintenable et bien testé.
  • 3+ années d'expérience en tant qu'ingénieur de données ou dans un rôle similaire.
  • Maîtrise de BigTable, BigQuery, Dataproc, Dataflow, Dataplex et Cloud Composer parmi d'autres services GCP.
  • Familiarité avec les cadres de traitement de données distribuées tels qu'Apache Beam et Apache Spark, avec une compréhension approfondie du traitement par lots et en flux.
  • Expérience avec des outils d'automatisation de flux de travail tels qu'Airflow ou des solutions gérées comme Composer et Astronomer.
  • Maîtrise de Python et SQL.
  • Expérience dans la création d'applications et d'outils internes pour les développeurs ou les chercheurs.
  • Expérience avérée avec les systèmes de traçabilité des données.
  • Expérience pratique avec Terraform, Docker, Kubernetes et CI/CD.
  • Connaissance des modèles et des meilleures pratiques IAM de GCP.
  • Expérience avec Mage ou Prefect est un plus.

Transparence salariale

Chez AssemblyAI, nous nous efforçons d'attirer et de retenir des talents exceptionnels issus de divers horizons avec un engagement en faveur de l'équité salariale. Nos fourchettes de salaires sont conçues pour être compétitives en fonction de notre taille, de notre stade et de notre industrie, tout en faisant partie