Czy pasjonuje Cię najnowsza technologia i innowacje w dziedzinie sztucznej inteligencji? NVIDIA poszukuje dynamicznego i doświadczonego Architekta Rozwiązań AI Generatywnej z wyspecjalizowaną wiedzą w zakresie szkolenia Dużych Modeli Językowych (LLM) oraz wdrażania workflowów opartych na Pretrainingu, Finetuningu LLM i Retrieval-Augmented Generation (RAG).
Jako kluczowy członek naszego zespołu rozwiązań AI, odegrasz istotną rolę w projektowaniu i dostarczaniu nowoczesnych rozwiązań wykorzystujących potężne technologie generatywnej AI NVIDIA. Ta pozycja wymaga głębokiego zrozumienia modeli językowych, szczególnie open-source'owych LLM, oraz silnej biegłości w projektowaniu i wdrażaniu workflowów opartych na RAG.
- Projektowanie end-to-end rozwiązań generatywnej AI skupiających się na szkoleniu LLM, wdrażaniu i workflowach RAG.
- Bliska współpraca z klientami w celu zrozumienia ich wyzwań związanych z językiem i projektowania dostosowanych rozwiązań.
- Wsparcie działań pre-sales, w tym techniczne prezentacje i demonstracje możliwości LLM i RAG.
- Ścisła współpraca z zespołami inżynieryjnymi NVIDIA w celu dostarczania opinii i przyczyniania się do rozwoju oprogramowania generatywnej AI.
- Bezpośrednie zaangażowanie w klientami/partnerami w celu zrozumienia ich wymagań i wyzwań.
- Prowadzenie warsztatów i sesji projektowych w celu definiowania i udoskonalania rozwiązań generatywnej AI skupionych na LLM i workflowach RAG.
- Szkolenie i optymalizacja Dużych Modeli Językowych przy użyciu sprzętu i oprogramowania NVIDIA.
- Implementacja strategii efektywnego i skutecznego szkolenia LLM w celu osiągnięcia optymalnej wydajności.
- Projektowanie i wdrażanie workflowów opartych na RAG w celu zwiększenia generowania treści i wyszukiwania informacji.
- Ścisła współpraca z klientami w celu integracji workflowów RAG w ich aplikacjach i systemach.
- Śledzenie najnowszych trendów w modelach językowych i technologiach generatywnej AI.
- Zapewnienie technicznego przywództwa i doradztwa w zakresie najlepszych praktyk szkolenia LLM i wdrażania rozwiązań opartych na RAG.
- Magisterium lub doktorat z informatyki, sztucznej inteligencji lub równoważne doświadczenie.
- 7-11+ lat praktycznego doświadczenia w technicznej roli AI, z silnym naciskiem na generatywną AI i szkolenie Dużych Modeli Językowych (LLM).
- Udokumentowane sukcesy w wdrażaniu i optymalizacji modeli LLM do wnioskowania w środowiskach produkcyjnych.
- Dogłębne zrozumienie najnowocześniejszych modeli językowych, w tym GPT-3, BERT lub podobnych architektur.
- Ekspertyza w szkoleniu i fine-tuningu LLM za pomocą popularnych frameworków takich jak TensorFlow, PyTorch lub Hugging Face Transformers.
- Biegłość w technikach wdrażania i optymalizacji modeli dla efektywnego wnioskowania na różnych platformach sprzętowych, ze szczególnym uwzględnieniem GPU.
- Silna znajomość architektury klastrów GPU i umiejętność korzystania z przetwarzania równoległego w celu przyspieszenia szkolenia i wnioskowania modeli.
- Doskonałe umiejętności komunikacyjne i współpracy, umiejętność artykułowania z