В компании Essential AI мы стоим перед увлекательной миссией – улучшить синергию между человеком и компьютером, значительно расширяя коллаборативные возможности за пределами текущих ограничений. Наша цель ясна: создавать исключительные пользовательские опыты, лидируя в инновациях от интерфейса пользователя до наиболее эффективных вычислительных моделей. Поддерживаемые ведущими инвесторами, такими как March Capital, Thrive Capital, AMD, Franklin Venture Partners, Google, KB Investment и NVIDIA, мы выращиваем компактную, динамичную команду, нацеленную на достижение прорывных успехов в области искусственного интеллекта.
В качестве ключевого члена нашего технического персонала ваша основная задача будет заключаться в разработке и реализации стратегий для оптимизации и уточнения моделей ИИ после первоначального обучения. Это включает улучшение производительности, надежности и эффективности модели. Сотрудничество между командами будет иметь решающее значение для выявления возможностей для улучшений после тренировки и оценки воздействия на функциональность модели.
- Вести и вносить значительный вклад в исследовательские инициативы, способствующие улучшению реального применения наших моделей ИИ.
- Тесно работать с продуктовыми командами для соединения исследований и разработки продукта, определяя пробелы и оценивая улучшения.
- Разрабатывать новаторские методы после тренировки для оптимизации моделей машинного обучения.
- Проводить бенчмаркинг и оценки различных стратегий после тренировки по нескольким наборам данных и архитектурам моделей.
- Анализировать результаты для выявления инсайтов о поведении моделей и определения возможностей для улучшения.
- Реализовать модели и алгоритмы для этапов после тренировки, оптимизируя производительность и масштабируемость в производственных условиях.
- Взаимодействовать с научными сотрудниками и инженерами для поиска дополнительных областей для улучшений после тренировки.
- Доказанный опыт исследовательской работы, сосредоточенной на послеобучении и оптимизации больших языковых моделей, с владением фреймворков, таких как Megatron, DeepSpeed, MaxText и т. д.
- Твердая основа в принципах машинного обучения, направляющая инновационные исследовательские подходы.
- Опыт в разработке или улучшении методов в области МЛ или смежных областях.
- Опыт выполнения задач по инженерии данных, таких как