Архитектор системы запросов - Ускоренный Apache Spark

  • Full Time
Job expired!
Мы ищем опытного архитектора системы запросов для улучшения Apache Spark и связанных с ним фреймворков для работы на GPU. Nvidia, лидер в области ускоренных вычислений, занимается разработкой экосистемы обработки данных следующего поколения. Apache Spark - это широко используемый движок распределенной обработки данных для различных нагрузок, включая подготовку данных, создание признаков, отчетность, аналитику и т.д. Такие нагрузки часто требуют значительного времени и вычислительной мощности, что затрудняет эффективное ведение бизнеса. В компании NVIDIA мы решаем сложные задачи, которые имеют значение. Вы будете сотрудничать с сообществом открытого кода для облегчения обработки данных Apache Spark на GPU. Ускорение рабочих процессов с данными может значительно помочь специалистам по данным, позволяя им изучать большие наборы данных быстрее и эффективнее, чтобы достичь своих бизнес-целей. Что вам предстоит делать: - Стать лидером в оптимизации запросов в команде RAPIDS Spark. - Оценивать каждую стадию обработки запроса, определять области для оптимизации логического и физического плана. Создавать оптимизированные планы с учетом ресурсов ЦП и GPU. - Определять возможности адаптивного выполнения запросов, учитывающих ресурсы, например, адаптация в зависимости от характеристик ЦП или GPU. - Определять области, где операторское слияние может улучшить производительность. - Изучать практику обработки данных в столбцовых движках, чтобы увидеть, как она может быть применима к обработке данных на GPU в формате столбцов. - Вести активное сотрудничество с сообществами открытого исходного кода, включая Apache Spark и RAPIDS, проводить технические обсуждения и вносить свой вклад. - Сотрудничать со стратегическими партнерами Nvidia по разработке решений для ускоренной обработки данных в облаке или на портальных кластерах. - Презентовать технические решения на отраслевых конференциях и встречах. Что мы хотели бы видеть: - Бакалавр, магистр или доктор наук в области компьютерных наук, компьютерной инженерии или эквивалентный опыт. - Более 15 лет работы или научных исследований в области разработки программного обеспечения независимо от размера проекта. - По меньшей мере 5 лет опыта работы с ключевыми проектами открытого исходного кода для работы с большими данными в качестве участника или коммиттера, включая Apache Spark, Apache Hadoop, Apache Hive, Apache Flink, Apache Impala, Apache Drill, Apache Calcite и Substrait. - Выдающиеся технические навыки в создании и внедрении распределенных систем высокого качества. - Глубокие знания движков запросов баз данных и оптимизации запросов. - Отличные навыки программирования на С++, Java и/или Scala. - Понимание планировщиков работ для распределенных систем: Kubernetes, Hadoop YARN, Spark standalone или Mesos. - Умение сотрудничать с многопрофильными командами в разных местах. - Сильная мотивация и межличностные навыки. Как выделиться из толпы: - Вклад в крупные проекты с открытым исходным кодом, такие как Apache Spark, Apache Hive, Apache Impala, Apache Drill, Substrait, Apache Calcite. - Опыт работы с библиотеками ускорения (CUDA, RAPIDS, UCX). - Базовый опыт работы с машинным обучением/глубоким обучением с использованием Spark ML и XGBoost. Мы признаны одним из самых привлекательных работодателей в техническом мире и поэтому гордимся наличием самых инновационных и упорных специалистов в наших командах. Если вы страстны, креативны и целеустремленны, мы будем рады, если вы присоединитесь к нашей команде. Кроме конкурентоспособной заработной платы и полного пакета социальных льгот, мы предлагаем творческую и автономную инженерную среду. Из-за безпрецедентного роста, мы быстро расширяем наши уникальные инженерные команды. Приглашаем кандидатов, вдохновленных искренней любовью к технологиям, подать заявку. Диапазон базовой заработной платы составляет от 268,000 USD до 414,000 USD. Ваша базовая заработная плата будет определена на основании вашего местонахождения, экспертизы и заработной платы сотрудников на аналогичных должностях. Вы будете иметь право на долю в капитале и другие льготы. NVIDIA принимает заявки на постоянной основе.