Стажировка в разработке наборов данных для компьютерного зрения и модели сверточной нейронной сети

  • Full Time
Job expired!

Описание компании

Убежденные в том, что технологии должны способствовать упрощению наших жилых пространств, устойчивому развитию и обеспечению безопасности, компания LACROIX (5300 сотрудников, оборот про форма €619M) поддерживает своих клиентов в дизайне и управлении умными жилыми экосистемами, благодаря подключенному оборудованию и технологиям, предлагая свою визию:

"Подключенные технологии для умного мира".

В центре стратегии Group's L25 находится Impulse — бизнес-единица по исследованиям и разработкам (R&D) в области электроники. Он объединяет ключевые технологии для поддержки компаний и отраслей в ускорении их технологического и цифрового преобразования. Предложение Impulse основано на полном спектре экспертизы в проектировании и индустриализации IoT-решений (оборудование, программное обеспечение и облако), AI, компьютерное зрение, кибербезопасность и многое другое, чтобы стать ведущим игроком в области промышленного IoT. Impulse нацелен на общественно значимые рынки с перспективами роста, особенно в области домашней автоматизации, промышленности, мобильности и автомобильной промышленности.

Основные команды Impulse (на данный момент 100 сотрудников), в основном, базируются в Cesson в сердце технологического бассейна Rennes и готовы к росту вместе с LACROIX, внося свой вклад в его развитие.

Описание работа

Тема: Набор данных и модель CNN для обнаружения объектов на дороге

Обнаружение и отслеживание объектов на видео предлагают широкий спектр приложений в робототехнике и в нашей повседневной жизни. Для этого использование глубоких нейронных сетей стало неотъемлемым благодаря их большому потенциалу в обучении значимым визуальным представлениям. В LACROIX-Impulse, исследовательском центре LACROIX в Ренн, мы считаем обнаружение объектов на дороге целью для наблюдения за движением и регулирования трафика.

Вы будете работать с Lesley-Ann, инженером по компьютерному зрению.

Цель стажировки заключается в изучении применения увеличения объема данных, таких как синтетические данные, генерируемые симулятором CAR Learning to Act (Carla), с целью улучшения обнаружения объектов в определенных условиях. Этот симулятор позволяет генерировать обучающие данные (изображения, оптический поток, сегментацию, траектории ...) в большом масштабе с конкретными объектами и параметрами, встречающимися в реальных видеосценах, но меньше доступными в существующих наборах данных, таких как COCO или Google OpenImage. Также может быть рассмотрено использование симулятора AirSim, а также создание виртуального города стажером. Также могут быть предложены улучшения существующей сети.

Ваши задачи:

  • Научитесь использовать симулятор CARLA для генерации синтетических обучающих данных с заданными параметрами и объектами.
  • Создайте пользовательский интерфейс для автоматизации создания этих новых наборов данных.
  • Сравните симулятор CARLA со своим конкурентом AirSim.
  • Проведите обработку, слияние и постобработку данных для подготовки обучающих и тестовых данных для сети.
  • Установите метрики для анализа наборов данных (существующих и синтетических).
  • Обучите модель обнаружения объектов на базе CNN с использованием увеличенного набора данных.
  • Установите бенчмаркинг для количественной оценки влияния добавления новых наборов данных на производительность сети в зависимости от их характеристик.
  • Не обязательно: поработайте над созданием новой карты, используемой в CARLA, сопоставив район Ренн с OpenStreetMap.
  • Напишите отчет, научную статью или заявку на изобретение в зависимости от полученных результатов.

Ожидаемые результаты

  • Пользовательский интерфейс, позволяющий генерировать синтетические данные из симулятора для задачи,
  • Увеличенный набор данных для обучения и тестирования модели обнаружения объектов на дороге построенной на основе CNN, который является слиянием синтетических и существующих наборов данных,
  • Обучение и тестирование модели CNN для задачи, с оценкой для подтверждения улучшения производительности обнаружения,
  • Метрики для анализа всего набора данных (синтетического и существующего)
  • Отчет и заявка на патент в зависимости от новизны изученного подхода.

Требования к квалификации

  • Вы учащийся в техническом вузе или магистратуре
  • О вас говорят, что вы творческий и автономный.
  • У вас есть определенная страсть к алгоритмам, особенно в компьютерном зрении, и вы хорошо владеете программированием на Python.
  • Успешный опыт с фреймворком машинного обучения и опыт использования 3D-движков (Unity, Unreal Engine) являются преимуществом (Pytorch, TensorFlow и т.д.).
  • Знание C, C++ или C# также будет плюсом.
  • В может быть необходимо работать в международном контексте, поэтому требуется хорошее знание английского языка.

Дополнительная информация

Предложение:

  • Оплачиваемая стажировка с доступом к скидкам в ресторанах
  • Возможность работать над инновационными и высокотехнологичными проектами
  • Работа под руководством опытной и увлеченной команды