Ingénieur de Données du Personnel

  • Full Time
Job expired!

NVIDIA recrute des spécialistes seniors en systèmes distribués avec une spécialisation en ingénierie des données pour développer et élargir ses plateformes d'IA et d'apprentissage en profondeur. Notre équipe construit une plateforme de développement de logiciels 2.0 axée sur les jeux de données pour le développement d'applications d'IA. Ensemble, nous renforcerons la capacité de NVIDIA à construire et déployer des solutions de pointe pour un large éventail d'applications basées sur l'IA, telles que les véhicules autonomes, la santé, la réalité virtuelle, les moteurs graphiques et l'informatique visuelle. Ensemble, avec les partenaires de NVIDIA, nous donnerons vie aux véhicules autonomes !

Ce que vous ferez :

  • Architecturer et construire des engagements évolutifs et distribués pour l'amélioration, le calcul et les pipelines de données qui aideront à alimenter le lac de données informatiques en tant que plateforme de données centralisée

  • Concevoir et construire des interfaces et des microservices de requêtes de données de la taille de PB et de données structurées/non structurées pour ingérer, indexer, extraire, transformer et composer de grands ensembles de données.

  • Construire des modèles de données de coûts et d'utilisations des Cloud pour parcourir, collecter et transformer des TB de données quotidiennement

  • Permettre des modèles/vues de données sur des TB de données qui peuvent être consommés par des outils analytiques comme PowerBI. Construire des analyses PBI pour les rapports financiers

  • Construire et mettre en œuvre un soutien pour des ensembles de données versionnés, traçables et immuables dans un lac de données de manière distribuée et évolutive.

  • Permettre une sélection de données efficace et réfléchie - l'un des ingrédients clés pour un apprentissage machine réussi !

  • Etre activement impliqué dans l'écriture de code de haute qualité, de bonne conception & architecture, entièrement testé et revu par des pairs.

  • Collaborer avec de multiples équipes de produits/ingénierie pour comprendre leurs besoins en données et en calcul (SW, HW, Automobile, AI) afin d'intégrer des innovations et des algorithmes incroyables dans nos systèmes de production

  • Automatiser tout pour mesurer, tester, mettre à jour, surveiller et alerter la plateforme de données

Ce que nous devons voir :

  • Licence (ou expérience équivalente) ou Master en Architecture Informatique, Informatique, ou un diplôme d'Ingénierie axé sur les données.

  • 8+ années d'expérience avérée en ingénierie des données, ayant travaillé sur la conception et le développement de logiciels avec Big Data, écosystème Data Lake/ Maison du Lac, Data Analytics, architecture de microservices backend, et types de données hétérogènes à grande échelle

  • Expérience approfondie avérée dans la création de pipelines ETL en utilisant Databricks, Spark, Python, SQL, Scala, Kafka, Presto, Parquet, Streaming, événements, bots, écosystème AWS/cloud

  • Compétences en développement de Micro Services et en utilisation de frameworks AWS tels que SQS, Stream, Kubernetes, EC2, S3, Lambda, etc.

  • Expérience avec les outils de pipelines/analyse/visualisation de données tels que Elastic stack, Logstash, Kibana, Kafka, Grafana, Splunk, Pandas, brokers de messages, Modélisation des données.

  • Expertise en architecture de maison du lac de données et techniques Databricks de bout en bout, y compris les composants de Data Science

  • A travaillé sur le cycle de vie complet des données, de l'ingestion des données à la transformation des données, en passant par la couche de consommation des données. Familiarisé avec l'API et son utilisation

  • Connaissance des solutions de Cloud comme Kendra, SageMaker, Auto-ML, Big Query, RedShift, Glue, Athena.

Comment se démarquer de la foule :

  • La compréhension et l'expérience autour des analyses de coûts et d'utilisations est un plus

  • Expert en Spark, Parquet, steaming, événements, Kafka, télémétrie, MapReduce, Hadoop, Hive, Presto, Spark, approches de requête de données, et tableau de bord.

  • Celui qui a mis en œuvre des cas d'utilisation d'entreprise comme CMDB, Gouvernance, classification de séries temporelles, détection d'anomalies de télémétrie, logs, et ingestion de données en temps réel via des API

  • Expérience avec des données structurées telles que Avro, Parquet, Protobuf, Thrift, et des concepts comme l'évolution des schémas.

  • Une connaissance pratique d'Amazon Web Services, Kubernetes, Docker est un plus.

NVIDIA est considérée comme l'un des employeurs les plus attractifs du monde de la technologie. Nous avons parmi nous certaines des personnes les plus avant-gardistes et les plus travailleuses de la planète. Si vous êtes créatif et autonome, nous souhaitons vous entendre !

La fourchette de salaires de base est de 160 000 USD - 304 750 USD. Votre salaire de base sera déterminé en fonction de votre localisation, de votre expérience, et du salaire des employés occupant des postes similaires.

Vous serez également éligible pour l'équité et les avantages.