Member of Technical Staff: Research Engineer, Post-Training

Other
San Francisco
06/12/2024
-

Job expired!

В компании Essential AI мы стоим перед увлекательной миссией – улучшить синергию между человеком и компьютером, значительно расширяя коллаборативные возможности за пределами текущих ограничений. Наша цель ясна: создавать исключительные пользовательские опыты, лидируя в инновациях от интерфейса пользователя до наиболее эффективных вычислительных моделей. Поддерживаемые ведущими инвесторами, такими как March Capital, Thrive Capital, AMD, Franklin Venture Partners, Google, KB Investment и NVIDIA, мы выращиваем компактную, динамичную команду, нацеленную на достижение прорывных успехов в области искусственного интеллекта.

В качестве ключевого члена нашего технического персонала ваша основная задача будет заключаться в разработке и реализации стратегий для оптимизации и уточнения моделей ИИ после первоначального обучения. Это включает улучшение производительности, надежности и эффективности модели. Сотрудничество между командами будет иметь решающее значение для выявления возможностей для улучшений после тренировки и оценки воздействия на функциональность модели.

Вести и вносить значительный вклад в исследовательские инициативы, способствующие улучшению реального применения наших моделей ИИ.
Тесно работать с продуктовыми командами для соединения исследований и разработки продукта, определяя пробелы и оценивая улучшения.
Разрабатывать новаторские методы после тренировки для оптимизации моделей машинного обучения.
Проводить бенчмаркинг и оценки различных стратегий после тренировки по нескольким наборам данных и архитектурам моделей.
Анализировать результаты для выявления инсайтов о поведении моделей и определения возможностей для улучшения.
Реализовать модели и алгоритмы для этапов после тренировки, оптимизируя производительность и масштабируемость в производственных условиях.
Взаимодействовать с научными сотрудниками и инженерами для поиска дополнительных областей для улучшений после тренировки.

Доказанный опыт исследовательской работы, сосредоточенной на послеобучении и оптимизации больших языковых моделей, с владением фреймворков, таких как Megatron, DeepSpeed, MaxText и т. д.
Твердая основа в принципах машинного обучения, направляющая инновационные исследовательские подходы.
Опыт в разработке или улучшении методов в области МЛ или смежных областях.
Опыт выполнения задач по инженерии данных, таких как