Описание работы:
- Сотрудничество с заинтересованными сторонами во всей организации для выявления возможностей использования данных компании для создания бизнес-решений и результатов.
- Изучение и анализ данных из баз данных компании для продвижения оптимизации и усовершенствования разработки продуктов, маркетинговых стратегий и бизнес-планов.
- Оценка эффективности и точности новых источников данных и методов сбора данных.
- Оказание помощи и сотрудничество с нашими командами по продукту, продажам, руководству и маркетингу, предоставляя им информацию, полученную в результате анализа данных компании.
- Владение навыками работы с большими данными для выявления возможностей оптимизации продуктов и процессов, а также использования моделей для проверки эффективности различных сценариев.
- Разработка уникальных моделей данных и алгоритмов для их использования на наборах данных.
- Применение прогнозной моделирования для повышения и улучшения пользовательского опыта, генерации прибыли, таргетирования рекламы и других бизнес-результатов.
- Создание системы A/B тестирования компании и тестирование качества моделей.
- Сотрудничество с различными функциональными командами для внедрения моделей и мониторинга результатов.
- Создание процессов и инструментов для мониторинга и анализа эффективности моделей и точности данных.
- Проектирование панелей управления и отчетов для визуализации данных (включая использование таких инструментов, как Tableau, Power BI и подобных, для создания интерактивных панелей управления и отчетов).
- Активное нахождение решений, скрытых в больших наборах данных.
Требования:
- Высшее образование в области информатики, бизнес-информатики, инжиниринга, финансов или в любой смежной области.
- Опыт работы 5+ лет, манипулирование наборами данных и построение статистических моделей, знакомство со следующими программными средствами/инструментами:
- Знание программирования и опыт работы с Java (желательно знание Spring framework).
- Владение рядом методов машинного обучения (кластеризация, обучение деревьев решений, искусственные нейронные сети и т.д.) и глубокое понимание их преимуществ и ограничений в реальном мире.
- Понимание продвинутых статистических методов и концепций (регрессия, свойства распределений, статистические тесты и их точность и т.д.) и знакомство с их применением.
- Знание и опыт применения статистических и майнинговых техник для данных: GLM/Regression, Random Forest, Boosting, Trees, text mining, social network analysis, etc.
- Опыт использования статистических компьютерных языков (R, Python, SQL и т.д.) для работы с данными и получения информации из больших наборов данных.
- Опыт работы с базами данных и использования статистических компьютерных языков: R, Python, SQL и т.д. & использование веб-сервисов: Redshift, S3, Spark, DigitalOcean и т.д.
- Опыт создания и использования передовых алгоритмов машинного обучения и статистики: регрессия, моделирование симуляции, анализ сценариев, моделирование, кластеризация, деревья решений, нейронные сети и т.д.
- Опыт анализа данных из сторонних источников: Google Analytics, Site Catalyst, Coremetrics, AdWords, Crimson Hexagon, Facebook Insights и т.д.
- Опыт работы с распределенными инструментами обработки данных: Map/Reduce, Hadoop, Hive, Spark, Gurobi, MySQL и т.д.
- Опыт визуализации/представления данных для заинтересованных сторон с использованием: Periscope, Business Objects, D3, ggplot и т.д.
- Опыт работы с созданием архитектуры данных.
- Способность и адаптивность к обучению и освоению новых технологий и методик.
- Сильные навыки решения проблем с акцентом на разработку продуктов.
- Отличные навыки письменной и устной коммуникации для координации работы между командами.