Data Scientist - New College Graduate

Job expired!

Описание компании

В Western Digital наша цель – продвигать глобальные инновации и переопределять границы технологии для достижения выдающихся результатов. Мы – компания решателей проблем, содействующая грандиозным достижениям на протяжении десятилетий, включая технологии, которые помогли высадить человека на Луну. Сотрудничая с некоторыми из крупнейших и самых быстрорастущих организаций мира, мы стимулируем инновации в конкурентных игровых платформах, безопасных городах, умных автомобилях и огромных дата-центрах крупных корпораций и публичных облаков.

Будь то просмотр сериалов, пролистывание социальных сетей или онлайн-шопинг, Western Digital играет ключевую роль в инфраструктуре хранения данных для этих платформ. Наши флэш-карты сохраняют ваши драгоценные моменты, а наш широкий портфель технологий, устройств хранения и решений, включая бренды Western Digital®, G-Technology™, SanDisk® и WD®, удовлетворяет потребности как бизнеса, так и потребителей.

Современные вызовы требуют ваших уникальных навыков. Вместе с Western Digital мы готовы стать следующей значительной инновацией в области данных.

  • Сбор и извлечение больших наборов структурированных и неструктурированных данных из баз данных, API и источников веб-скрейпинга.
  • Разработка предсказательных моделей с использованием алгоритмов машинного обучения для прогнозирования трендов и результатов.
  • Интеграция AI-агентов для автоматизированного сбора данных, предварительной обработки и анализа для повышения эффективности и масштабируемости.
  • Использование генеративных моделей ИИ для создания синтетических данных, дополнения наборов данных и генерации аналитических выводов.
  • Развертывание, мониторинг и поддержка разработанных моделей, систем и AI-агентов для обеспечения их эффективности.
  • Документирование процессов и методологий для воспроизводимости и аудита.
  • Сотрудничество с кросс-функциональными командами, такими как менеджеры по продукту, программисты и бизнес-аналитики, для выявления бизнес-проблем и разработки решений.
  • Объяснение сложных технических концепций нетехническим заинтересованным сторонам в ясной и краткой форме.
  • Степень магистра в области науки о данных, компьютерных наук, статистики, математики, физики или инженерии.
  • Знание жизненного цикла управления AI/ML и инструментов, включая EDA, моделирование, интеграцию/развертывание, обнаружение дрейфа данных/моделей и повторное обучение моделей.
  • Знакомство со статистическими и методами машинного обучения, такими как регуляризованная регрессия, анализ временных рядов, деревья решений, алгоритмы бустинга, нейронные сети, кластеризация и коллаборативная фильтрация.
  • Опыт работы с источниками структурированных, полуструктурированных и неструктурированных данных.
  • Опыт в веб-скрейпинге, обработке естественного языка и визуализации данных.
  • Опыт работы с коллаборативными решениями, версионирование моделей и кода (Github), упаковка решений (Docker) и развертывание моделей (Dataiku).
  • Свободное владение языками программирования, такими как Python, R и SQL; знаком с инструментами, такими как Tableau, PowerBI или Spotfire, NumPy, Pandas и Matplotlib.
  • Опыт разработки и развертывания генеративных моделей ИИ и больших языковых моделей (LLM).
  • Навыки автоматизации процессов с использованием роботов (RPA) и разработки программного обеспечения для автоматизации.
  • Знание принципов UI и UX дизайна для улучшения взаимодействия и пользовательского опыта в приложениях на базе данных.
  • Способность определять проблемы, генерировать гипотезы, разрабатывать и тестировать решения, а также эффективно объяснять сложные технические концепции нетехническим заинтересованным сторонам.
  • Внимание к деталям и отличные навыки сотруднич