Инженер, Платформа Данных
- Other
- San Francisco
- $69 K - $128 K
- Full Time
Pinecone уделяет особое внимание разработке технологии поиска и баз данных для улучшения AI приложений на протяжении следующего десятилетия и далее. Наша удобная векторная база данных упрощает интеграцию векторного поиска в AI приложения. С тех пор, как мы стали первопроходцами в категории "векторные базы данных", спрос на них взлетел, что отражается в расширении нашей пользовательской базы.
Мы - распределенная команда с кластерами в Нью-Йорке, Сан-Франциско, Тель-Авиве и Манчестере.
Pinecone ищет опытного и высокомотивированного инженера для внутренней команды по работе с данными, которая будет отвечать за разработку и поддержку нашей инфраструктуры данных. Это обеспечит эффективную оркестрацию, управление, качество и доступность данных по всей организации. Как старший инженер в команде по работе с данными, вы будете играть ключевую роль в создании и оптимизации нашей экосистемы данных для обеспечения поставки данных, их понимания, получения важной информации и работы с данными в большом масштабе.
Вы будете работать в быстром и плодотворном окружении, которое требует работу высокого качества с минимальным надзором. Вы также будете сильным специалистом в общем потоке, поскольку у нас все носят много шляп, и вы будете напрямую работать с исполнительным руководством и наставничать новых инженеров и ученых по работе с данными.
Проектирование и создание инфраструктуры данных
Создайте масштабируемую, эффективную инфраструктуру данных, включая оркестровку, метрический магазин, магазин функций, управление, качество данных, систему оповещения и обратные процессы ETL.
Обеспечение качества и управления данными
Разработать надежный инструментарий / рамки для обеспечения качества данных и процессы управления для поддержания высокого качества и целостности данных на протяжении всего жизненного цикла данных.
Сотрудничество с командами по работе с данными и разработке
Тесное взаимодействие с командами по работе с данными для понимания их потребностей и обеспечения предоставления и использования данных для моделирования, экспериментирования и анализа.
Страсть к технологиям
5+ лет опыта работы с SQL и Python
5+ лет опыта в разработке высокопроизводительных систем
Бакалавр в области компьютерных наук, математики, технической специальности или эквивалентный опыт
Глубокие знания в области баз данных, хранения данных, инфраструктуры данных, ELT/ETL
Опыт работы по созданию и оптимизации инфраструктуры данных с использованием современных технологий и рамок (например, Kafka, Airflow, API Integrations, CI/CD, Terraform и т.д.).
Опыт работы с платформами для оркестрации
Опыт работы с инфраструктурой управления данными (RBAC, качество данных, оповещение и т.д.)
Опыт работы с решениями для облачного хранилища данных (BigQuery, Snowflake)
Знакомство и опыт работы с развертыванием кода и управлением ресурсами K8s