Senior Data Engineer

Job expired!

Про Нас

Заснована у 2018 році, Causaly революціонізує спосіб, яким люди набувають знання та розвивають інсайти в біомедицині. Наша передова генеративна платформа штучного інтелекту покращує дослідницькі інсайти та автоматизацію знань, дозволяючи тисячам науковців виявляти важливі докази з мільйонів академічних публікацій, клінічних випробувань, регуляторних документів, патентів та інших джерел даних за лічені хвилини.

Ми пишаємося партнерством з деякими з найбільших біофармацевтичних компаній і установ світу, зосереджуючись на таких випадках використання, як Відкриття Ліків, Безпека та Конкурентна Розвідка. Дізнайтесь більше про наш шлях та про те, як ми прискорюємо набуття знань та покращуємо прийняття рішень на нашому блозі.

Підтримані провідними венчурними капіталістичними фірмами, такими як ICONIQ, Index Ventures, Pentech та Marathon, Causaly має на меті здійснити значний вплив у галузі біомедицини.

Ми шукаємо досвідченого старшого інженера з обробки даних, щоб приєднатися до нашої команди Technologies даних та семантики та допомогти розвивати її. Ця команда має вирішальне значення у розробці та створенні масштабованої та гнучкої бази даних, яку нам потрібна в Causaly для втілення нашого бачення.

Роль включає роботу над інкрементними конвеєрами даних для обробки як партійних, так і цільових оновлень, підтримку величезних графів знань та онтологій, а також наповнення нашого постійно зростаючого сховища даних. Ви будете тісно співпрацювати з командами Applied AI та Application, щоб створювати реальну бізнес-цінність за допомогою даних.

Ваші обов'язки:

  • Збір і розуміння даних на основі бізнес-вимог.
  • Імпорт великих наборів даних (мільйони записів) з форматів, таких як CSV, XML, SQL, JSON до BigQuery.
  • Обробка та комбінація даних на BigQuery з зовнішніми джерелами даних.
  • Реалізація та підтримка високопродуктивних конвеєрів даних, забезпечуючи дотримання галузевих найкращих практик щодо масштабованості, відмовостійкості та надійності.
  • Розробка інструментів для моніторингу, аудиту, експорту та отримання інсайтів з конвеєрів даних.
  • Співпраця з технічними, продуктовими та бізнес-стейкхолдерами для надання бекенд-рішень для даних.
  • Управління процесами даних, пов'язаних з доставкою, курацією та операціями машинного навчання.
  • Створення сильної функції інженерії даних, наставництво інших інженерів, формування нашої технологічної стратегії та інновації в нашій інфраструктурі даних.

Вимоги для успіху:

Мінімальні вимоги:

  • Ступінь магістра в галузі комп'ютерних наук, математики або суміжній технічній області.
  • 5+ років досвіду в відновленні даних та конвеє