Главный инженер по данным AI

  • Full Time
Job expired!
Это гибридная роль с местом работы в наших офисах в Пало-Альто или Сан-Франциско, и она потребует вашего присутствия в офисе по вторникам и четвергам. Что такое интересного в этой работе? Мы в Grindr верим, что ИИ может революционизировать индустрию знакомств. Наш ведущий инженер по данным отвечает за создание качественных наборов данных ML в масштабе, используемых для обучения моделей ML, которые обеспечивают функции, основанные на ИИ. В этой важнейшей роли вы получите возможность создать основные инструменты и конвейеры данных для усвоения, нормализации и очистки ценных данных, которые будут основными для наших инженеров ML в Grindr для создания инструментов ИИ, включая рекомендации, LLM, рекламу, визуальный поиск, рост/уведомления, доверие и безопасность. Что такое работа? Мы ищем выдающегося инженера по данным, который увлечен данными для ИИ и ценит его для Grindr, кто любит работать с операциями по данным в масштабах; и кто готов к трудной работе, необходимой для постоянного улучшения наших конвейеров данных ML. На этой должности вы будете отвечать за разработку и реализацию стратегии нашего мотора данных ML организации, с первоначальным акцентом на гибкую работу с данными ML. Это включает в себя определение компонентов инфраструктуры и стека данных, которые будут использоваться, проектирование и реализацию конвейеров между системами данных и командами, автоматизацию рабочих процессов, обогащение данных и инструменты мониторинга для моделей ИИ. Как ведущий технический специалист, специализирующийся на инжиниринге данных, от вас ожидается кодирование и вклад в стек. Обязанности: - Погрузиться в наш набор данных и спроектировать, реализовать и масштабировать предварительные/последующие конвейеры обработки данных для моделей ML - Работать над прикладными решениями ML в области добычи данных, очистки, нормализации и моделирования - Быть самомотивированным в поиске решений, когда правильный путь не всегда известен - Сотрудничать с инженерами в концептуализации, планировании и реализации инициатив по инжинирингу данных, работая с разными заинтересованными сторонами - Построить платформы и рамки данных для обработки больших объемов данных в режиме реального времени, а также в пакетном режиме, которые будут использоваться в командах разработки - Создать потоки обработки данных для очистки и моделирования текстовых данных для LLM - Исследовать и оценивать новые технологии в области больших данных для определения нашего постоянного совершенствования - Сотрудничать с многофункциональными командами для настройки производительности крупных приложений для обработки данных - Работать с командой по конфиденциальности и безопасности по вопросам управления данными, риска и соблюдения нормативных требований - Работать над инициативами по обеспечению стабильности, производительности и надежности нашей инфраструктуры данных Что мы полюбим в тебе: - Бакалавр по специальности «Компьютерные науки», «Математика», «Физика» или смежные области - 5+ лет опыта работы инженером по данным, создающим производственные предварительные/последующие конвейеры обработки данных для моделей ML/DL, включая 2+ года технического руководства - Опыт статистического анализа и визуализации наборов данных с использованием Pandas или R - Опыт проектирования и создания высокодоступных, распределенных систем извлечения, усвоения, нормализации и обработки больших наборов данных в реальном времени, а также в пакетном режиме, которые будут использоваться командами разработки, используя рамки оркестровки, такие как Airflow, KubeFlow или другие инструменты конвейера - Демонстрированный предыдущий опыт создания конвейеров данных для наборов текстовых данных NLP/ большие языковые модели - Способность создавать хорошо разработанное программное обеспечение, включая соответствующие автоматизированные наборы тестов, техническую документацию и операционную стратегию - Отличные навыки программирования на Python, Java, bash, SQL, а также опыт работы с контролем версий Git - Опыт использования технологий больших данных (Snowflake, Airflow, Kubernetes, Docker, Helm, Spark, pySpark) - Опыт работы с любой облачной средой - AWS, GCP или Azure - Значительный опыт работы с реляционными базами данных и созданием запросов (SQL), а также базами данных NoSQL, такими как DynamoDB и т. д. - Опыт построения и поддержки ETL (управление надежными конвейерами ETL высокого качества) Мы будем в восторге, если у вас есть: - 2+ года опыта технического руководства по созданию конвейеров инженерии данных для ИИ - Предыдущий опыт создания конвейера данных для API разговорного ИИ и системы рекомендаций - Опыт работы с распределенными системами и микросервисами - Опыт работы с Kubernetes и созданием Docker-образов - Опыт работы со строительством систем обработки потоков, используя решения, такие как Kafka, Storm или Spark-Streaming - Сильное понимание прикладных тем машинного обучения - Быть знакомым с юридическим соблюдением (с инструментами управления данными) классификацией данных и их удержанием - Постоянный опыт управления и реализации сложных проектов по данным Что вам понравится у нас - Миссия и влияние: Grindr является ведущим в мире службой социальной сети для ЛГБТ-сообщества. Ваша роль повлияет на жизнь миллионов ЛГБТ-людей по всему миру - Несколько мест: Мы нанимаем кого-то для этой роли, желательно, находящегося в Сан-Франциско или Пало-Альто - Семейная страховка: страхование премий на здоровье, стоматологию и зрение для вас и частичное покрытие для ваших иждивенцев - Накопление на пенсию: щедрый план 401K с сопоставлением 6% и немедленным вложением в США - Компенсация: Конкурентоспособная заработная плата на уровне отрасли и возможность участия в программах бонусов и акций компании - Включенные в бенефиты ЛГБТ: ведущие в отрасли предложения по подтверждению пола, покрывающие до 90% стоимости, доступ к Included Health, ежемесячные пособия на ГТР и многое другое - Дополнительные льготы: гибкая политика отпуска, ежемесячные пособия на мобильный телефон, интернет, благополучие и питание, единовременная надбавка на организацию домашнего офиса и компания, спонсирующая мероприятия О Grindr Grindr является крупнейшим в мире приложением для знакомств для геев, би, транс и квир людей. С около 13 миллионов активных пользователей в месяц, Grindr стал неотъемлемой частью глобального ЛГБТ-сообщества, и мы гордимся возможностью способствовать соединению наших пользователей, их выражению себя, и открытию для них квир-мира. Наше следующее развитие уже началось как новая публичная компания, стремящаяся расшириться и продолжать создавать значимые ощущения для наших пользователей. От социальных вопросов до оригинального контента, мы продвигаемся по инновационным путям с влиянием на наше сообщество, при этом используя последние технологические стеки и стремясь к инженерному совершенству. В центре нашей работы на этой новой стадии находится общий набор основных ценностей: открытость и исследовательский подход, предвзятость к действию и сильная поддержка ЛГБТ-сообщества. Мы имеем записи о сильной финансовой деятельности и планируем продолжить увеличение числа работников. Мы хотим создать команду талантливых, страстных и открытых людей, которые верят в нашу миссию, согласны с нашими ценностями и в восторге от работы на пересечении инновационной технологии и социального влияния. Присоединитесь к нам в этом волнующем путешествии. Grindr является работодателем, предоставляющим равные возможности Чтобы узнать больше о том, как мы обрабатываем персональные данные кандидатов, посетите нашу политику конфиденциальности для сотрудников и кандидатов. #LI-Hybrid