Machine Learning Engineer

Job expired!

О компании Sayari: В Sayari мы на переднем крае разведки рисков контрагентов и цепочек поставок и являемся доверенным поставщиком для государственных органов, многонациональных корпораций и финансовых институтов по всему миру. Наша продвинутая платформа анализа сетей, базирующаяся в Вашингтоне, округ Колумбия, использует данные о корпоративной собственности, цепочках поставок, транзакционных операциях и разведке рисков более чем из 250 юрисдикций для выявления скрытых рисков. С решениями, поддерживающими аналитиков на передовой более чем в 35 странах, Sayari посвящена улучшению глобальной коммерческой и финансовой прозрачности с использованием открытых данных. Наша корпоративная культура поощряет поиск оригинальных решений сложных проблем, способствует сотрудничеству между командами, непрерывному обучению и инновациям.

Вы будете играть ключевую роль в команде данных Sayari, используя свой опыт для формирования нашей стратегии и архитектуры ИИ. С помощью Sayari Graph, нашего флагманского продукта, у вас будет прямой доступ к структурированной деловой информации, полученной из обширных корпоративных, юридических и торговых записей. Ваша задача будет заключаться в работе с нашими командами продукта и программного обеспечения для разработки моделей машинного обучения, что, в свою очередь, обогатит наши данные, улучшит разрешение сущностей и интегрирует функции ИИ в Sayari Graph.

  • Более 4 лет опыта в разработке ИИ/ML от прототипа до производства, включая владение классическими моделями машинного обучения, такими как Наивный Байес, Деревья решений, KNN, а также передовыми техниками в области NLP и LLMs.
  • Обширный опыт работы с Apache Spark и Spark ML, Apache Airflow и различными инструментами ML/MLOps (например, MLflow, Label Studio).
  • Владение Python и языком на JVM (например, Scala).
  • Практический опыт работы с Google Cloud Platform и средами коллаборативной разработки, использующими git, тестирование и код-ревью.
  • Знакомство с библиотеками Spark, такими как GraphFrames, Spark NLP и cuGraph.
  • Опыт работы с SQL и NoSQL базами данных и хранилищами данных, такими как BigQuery.
  • Навыки работы с Docker/Kubernetes и опыт управления командой и наставничества.

Высшее образование в области компьютерных наук, статистики, инженерии или в смежной количественной области.