Вы увлечены передовыми технологиями и инновациями в области ИИ? NVIDIA ищет динамичного и опытного архитектора решений в области генеративного ИИ с профильной экспертизой в области обучения моделей больших языков (LLM) и реализации рабочих процессов на основе предварительного обучения, тонкой настройки LLM и генерации с дополнением поиска (RAG).
Как ключевой член нашей команды по ИИ-решениям, вы сыграете решающую роль в архитектуре и поставке передовых решений, использующих мощные технологии генеративного ИИ от NVIDIA. Эта позиция требует глубокого понимания языковых моделей, особенно моделей с открытым исходным кодом LLM, и высокой компетентности в разработке и реализации рабочих процессов на основе RAG.
- Архитектура полных решений генеративного ИИ с фокусом на обучение LLM, развертывание и рабочие процессы RAG.
- Тесное сотрудничество с клиентами для понимания их задач, связанных с языком, и разработки индивидуальных решений.
- Поддержка предпродажной деятельности, включая технические презентации и демонстрации возможностей LLM и RAG.
- Тесное взаимодействие с инженерными командами NVIDIA для предоставления обратной связи и вклада в развитие программного обеспечения для генеративного ИИ.
- Прямое взаимодействие с клиентами/партнерами для понимания их требований и задач.
- Проведение семинаров и сессий по проектированию для определения и доработки решений генеративного ИИ, ориентированных на LLM и рабочие процессы RAG.
- Руководство обучением и оптимизацией моделей больших языков с использованием аппаратных и программных платформ NVIDIA.
- Реализация стратегий эффективного и результативного обучения LLM для достижения оптимальной производительности.
- Разработка и внедрение рабочих процессов на основе RAG для улучшения генерации контента и поиска информации.
- Тесное сотрудничество с клиентами для интеграции рабочих процессов RAG в их приложения и системы.
- Слежение за последними разработками в области языковых моделей и технологий генеративного ИИ.
- Предоставление технического лидерства и рекомендаций по лучшим практикам для обучения LLM и реализации решений на основе RAG.
- Магистерская или докторская степень в области компьютерных наук, искусственного интеллекта или эквивалентный опыт.
- 7-11+ лет практического опыта в технической роли ИИ, с сильным акцентом на генеративный ИИ и обучение моделей больших языков (LLM).
- Доказанный опыт успешного развертывания и оптимизации моделей LLM для интерференции в производственных средах.
- Глубокое понимание современных языковых моделей, включая GPT-3, BERT или аналогичные архитектуры.
- Экспертиза в обучении и тонкой настройке LLM с использованием популярных фреймворков, таких как TensorFlow, PyTorch или Hugging Face Transformers.
- Навыки развёртывания моделей и оптимизационных техник для эффективной интерференции на различных аппаратных платформах, с акцентом на GPUs.
- Сильные знания архитектуры GPU-кластеров и умение использовать параллельную обработку для ускоренного обучения и интерференции моделей.
- Отличные навыки коммуникации и взаимодействия, способность излагать сложные технические концепции как техническим, так и нетехническим аудиенциям.
- Опыт проведения семинаров, обучающих сессий и презентаций технических решений для разнообразных аудиторий.
- Опыт развертывания моделей LLM в облачных средах (например, AWS, Azure, GCP) и инфраструктуре на месте.
- Доказанная способность оптимизировать модели LLM для скорости реализации, эффективности памяти и использования ресурсов.
- Знание технологий контейнеризации (например, Docker) и инструментов оркестрации (например, Kubernetes) для масштабируемого и эффективного разверты