Member of Technical Staff: Research Engineer, Post-Training

Job expired!

В компании Essential AI мы стоим перед увлекательной миссией – улучшить синергию между человеком и компьютером, значительно расширяя коллаборативные возможности за пределами текущих ограничений. Наша цель ясна: создавать исключительные пользовательские опыты, лидируя в инновациях от интерфейса пользователя до наиболее эффективных вычислительных моделей. Поддерживаемые ведущими инвесторами, такими как March Capital, Thrive Capital, AMD, Franklin Venture Partners, Google, KB Investment и NVIDIA, мы выращиваем компактную, динамичную команду, нацеленную на достижение прорывных успехов в области искусственного интеллекта.

В качестве ключевого члена нашего технического персонала ваша основная задача будет заключаться в разработке и реализации стратегий для оптимизации и уточнения моделей ИИ после первоначального обучения. Это включает улучшение производительности, надежности и эффективности модели. Сотрудничество между командами будет иметь решающее значение для выявления возможностей для улучшений после тренировки и оценки воздействия на функциональность модели.

  • Вести и вносить значительный вклад в исследовательские инициативы, способствующие улучшению реального применения наших моделей ИИ.
  • Тесно работать с продуктовыми командами для соединения исследований и разработки продукта, определяя пробелы и оценивая улучшения.
  • Разрабатывать новаторские методы после тренировки для оптимизации моделей машинного обучения.
  • Проводить бенчмаркинг и оценки различных стратегий после тренировки по нескольким наборам данных и архитектурам моделей.
  • Анализировать результаты для выявления инсайтов о поведении моделей и определения возможностей для улучшения.
  • Реализовать модели и алгоритмы для этапов после тренировки, оптимизируя производительность и масштабируемость в производственных условиях.
  • Взаимодействовать с научными сотрудниками и инженерами для поиска дополнительных областей для улучшений после тренировки.
  • Доказанный опыт исследовательской работы, сосредоточенной на послеобучении и оптимизации больших языковых моделей, с владением фреймворков, таких как Megatron, DeepSpeed, MaxText и т. д.
  • Твердая основа в принципах машинного обучения, направляющая инновационные исследовательские подходы.
  • Опыт в разработке или улучшении методов в области МЛ или смежных областях.
  • Опыт выполнения задач по инженерии данных, таких как