Інженер, платформа даних
- Other
- San Francisco
- $69 K - $128 K
- Full Time
Pinecone присвячена розвитку технологій пошуку та баз даних для покращення AI-додатків на наступне десятиліття і далі. Наша зручна векторна база даних спрощує вбудовування векторного пошуку в AI додатки. З того часу, як ми стали пионерами в категорії "векторна база даних", попит стрімко зріс, що відображено в розширенні нашої бази користувачів.
Ми є розподіленою командою з кластерами в Нью-Йорку, Сан-Франциско, Тель-Авіві та Манчестері.
Pinecone шукає вмілого та високомотивованого інженера для нашої внутрішньої команди Data Platform, який буде контролювати розвиток та обслуговування нашої інфраструктури даних. Це забезпечить ефективну оркестрацію, управління, якість та доступність даних в усій організації. Будучи старшим інженером в команді Data, ви відіграєте важливу роль у створенні та оптимізації нашого екосистеми даних для забезпечення доставки даних, розуміння їх, отримання висновків та роботи з науковцями щодо даних в масштабі.
Ви будете працювати в швидкому та заробітчаному середовищі, яке вимагає високоякісної роботи з мінімальним наглядом. Ви також будете сильним генералістом, оскільки всі ми виконуємо багато ролей, і ви будете прямо працювати з керівництвом і наставляти нових інженерів та науковців
Проектування та створення інфраструктури даних
Створення масштабованої, ефективної інфраструктури даних, включаючи оркестрацію, метричний магазин, магазин особливостей, управління, якість даних, систему сповіщень та процеси зворотного ETL.
Забезпечення якості даних та управління ними
Розробка надійної системи/інструментів контролю якості даних та процесів управління для підтримки високої якості та інтегральності даних на протязі всього життєвого циклу.
Співпраця з командами Data Science та Engineering
Тісна робота з командами науковців по даних для визначення їх потреб та забезпечення надання та використання даних для моделювання, експериментів та аналізу.
Пріоритет технологій
5+ років досвіду роботи з SQL та Python
5+ років досвіду створення та розвитку високоефективних систем
Освіта з комп'ютерних наук, математики, пов'язаної технічної галузі або еквівалентний досвід
Глибокі знання в базах даних, складах, інфраструктурі даних, ELT/ETL
Впевненість у створенні та оптимізації інфраструктури даних за допомогою сучасних технологій та фреймворків (наприклад, Kafka, Airflow, API Integrations, CI/CD, Terraform, і т.д.).
Досвід роботи з платформами оркестрації
Досвід роботи з інфраструктурою управління даними (RBAC, Data Quality, Alerting, і т. д.)
Досвід роботи з рішеннями для облачних баз даних (BigQuery, Snowflake)
Знайомство та досвід з розгортанням коду та управлінням ресурсів K8s