Опис роботи:
- Співпраця з зацікавленими сторонами по всій організації в питанні виявлення можливостей використання корпоративних даних для реалізації бізнес-рішень і досягнення результатів.
- Поглиблене вивчення та аналіз даних з корпоративних баз даних з метою оптимізації та покращення розробки продукту, маркетингових стратегій та бізнес-планів.
- Оцінка ефективності та точності нових джерел даних та методик збору даних.
- Надання допомоги та співпраця з нашими командами продукту, продажів, керівництва та маркетингу, надаючи їм інформативні дані, отримані в результаті аналізу даних компанії.
- Вміння використовувати великі набори даних для виявлення можливостей оптимізації продукту та процесу, а також використання моделей для тестування ефективності різних сценаріїв.
- Розробка унікальних моделей даних і алгоритмів для використання в наборах даних.
- Використання прогностичного моделювання для підвищення та покращення клієнтського досвіду, генерації доходу, цілеспрямованості реклами та інших бізнес-результатів.
- Створення корпоративної системи тестування A/B та тестування якості моделі.
- Співпраця з різними функціональними командами для впровадження моделей і моніторингу результатів.
- Створення процесів та інструментів для контролю та аналізу продуктивності моделі та точності даних.
- Проектування інформаційних панелей та звітів для візуалізації даних (це включає використання таких інструментів, як Tableau, Power BI, та інших для створення інтерактивних інформаційних панелей та звітів).
- Завзяте виявлення рішень, прихованих в середині великих наборів даних.
Вимоги:
- Ступінь бакалавра в галузі комп'ютерних наук, бізнес-інформатики, інженерії, фінансів або будь-яких суміжних галузей.
- 5+ років досвіду, здібність до обробки наборів даних та створення статистичних моделей, знайомство з наступними програмами/інструментами:
- Знання програмування та досвід роботи в Java (надається перевага знанню Spring framework).
- Володіння різними техніками машинного навчання (кластеризація, вивчення дерев прийняття рішень, штучні нейронні мережі тощо) та глибоке розуміння їх переваг та обмежень у реальному світі.
- Розуміння передових статистичних технік та понять (регресія, властивості розподілів, статистичні тести та їх точність тощо) та знайомство з додатками.
- Знання та досвід в статистичних та методах добування даних: GLM/Regressія, Random Forest, Boosting, Trees, текстовий майнінг, аналіз соціальних мереж тощо.
- Досвід використання статистичних мов програмування (R, Python, SQL та ін.) для обробки даних та виявлення інформації в великих наборах даних.
- Досвід в отриманні даних з баз даних та використанні мов програмування - R, Python, SQL, та ін., а також використання веб-сервісів: Redshift, S3, Spark, DigitalOcean, та ін.
- Досвід створення та використання передових алгоритмів машинного навчання та статистики: регресія, симуляція, сценарний аналіз, моделювання, кластеризація, дерева прийняття рішень, нейронні мережі, та ін.
- Досвід аналізу даних з третіх джерел: Google Analytics, Site Catalyst, Coremetrics, AdWords, Crimson Hexagon, Facebook Insights, та ін.
- Досвід з розподіленими інструментами обробки даних: Map/Reduce, Hadoop, Hive, Spark, Gurobi, MySQL, та ін.
- Досвід візуалізації / подання даних для зацікавлених сторін за допомогою: Periscope, Business Objects, D3, ggplot, та ін.
- Досвід роботи з архітектурою даних та її створенням.
- Спроможність та гнучкість в навчанні та володінні новими технологіями та методиками.
- Високі навички вирішення проблем з акцентом на розробку продукту.
- Відмінні навички письмового та усного комунікування для координації роботи в командах.