Consultant Data Scientist
- Data Scientist
- Other places
- 06/12/2024
- -
Використання даних для проектування, розробки та вдосконалення моделей Generative AI, використовуючи знання в області машинного навчання, глибокого навчання і статистики.
Використання Python для створення якісних систем GenAI. Високий рівень навичок у використанні бібліотек і фреймворків Python, таких як NumPy, Pandas, PyTorch/TensorFlow, Llamachain та LangChain. Великий досвід розробки з LLM, переважно з GPT-4 та Llama2. Великий досвід роботи з методами вбудовування.
Потрібно мати досвід в оптимізації та налаштуванні LLM/Embedding і оцінюванні LLM.
Будувати та підтримувати надійні дані пайплайн, які відповідають за збір, очищення, обробку та перетворення сирих даних у придатний для моделей Generative AI формат.
Проводити ретельне тестування та валідацію моделей для забезпечення точності, якості та загальної придатності для нерозглянутих наборів даних.
Бути в курсі останніх розробок в галузі Data Science, AI і машинного навчання для постійного вдосконалення методологій проекту та результатів.
Чітко і лаконічно представляти результати складних досліджень стейкхолдерам з різними фонами та радити найкращі стратегії на основі висновків моделі.
Забезпечити, щоб всі розроблені моделі та алгоритми були відповідно до стандартів та найкращих практик KPMG, дотримуючись всіх відповідних регуляторних та корпоративних політик конфіденційності.
Мінімум 3+ роки розробки/досвіду ML в масштабуємих системах продукційного рівня.
Сильна база в розробці проектів даної науки та обробці складних великих наборів даних — невпорядкованих, напівструктурованих або структурованих.
Проведення всебічного аналізу даних і моделювання, застосування методів AI/ML та статистики до великих наборів даних для ефективного вилучення корисної інформації і генерації творчих результатів.
Досвід роботи з методологіями SDLC, зокрема Agile, т