Приєднуйтесь до світового лідера цифрової трансформації! У CI&T ми співпрацюємо з найбільш відомими брендами у світі, щоб створювати інноваційні цифрові рішення, які революціонізують бізнес. Завдяки 29-річній спадщині впливу на бізнес, наша команда з понад 6 000 професіоналів у всьому світі спеціалізується на стратегії, дослідженнях, науці про дані, дизайні та інженерії для сприяння росту, покращення досвіду клієнтів та оптимізації операційної ефективності.
CI&T шукає досвідчених Data Scientists з експертизою в області обробки природної мови (NLP) для керування ініціативами штучного інтелекту в американській індустрії охорони здоров'я. Як ключовий учасник, ви будете сприяти бізнес-впливу, використовуючи передові рішення штучного інтелекту.
- Проведення дослідження даних для перевірки вимог до даних та їх якості в контексті NLP.
- Виконання попередньої обробки NLP, включаючи токенізацію, лексичний аналіз, синтаксичний аналіз, семантичний аналіз і прагматичний аналіз.
- Визначення та узгодження найкращих моделей NLP з очікуваними результатами бізнесу.
- Навчання та перевірка моделей з використанням метрик, таких як точність, точність (precision), виклик (recall), F1-оцінка та ROUGE-оцінка.
- Документування процесів розробки моделей, методологій та результатів для всіх зацікавлених сторін.
- Реалізація класифікації тексту та аналізу настроїв з використанням традиційних машинних алгоритмів та глибокого навчання.
- Покращення продуктивності моделей NLP через ретельні експерименти та аналіз.
- Використання технік моделювання тем, таких як LDA та NMF, для виявлення абстрактних тем з текстових даних.
- Розуміння та застосування моделей послідовність-до-послідовності для перекладу машин, підсумовування тексту та відповідей на запитання.
- Вільне володіння англійською мовою в усній та письмовій формі.
- Досвід роботи у міжнародних проєктах та в ролі Data Scientist у проєктах NLP.
- Експертиза в Python з акцентом на пакети такі як NLTK, spaCy та Gensim.
- Досвід роботи з техніками, такими як тематичний відбір, підсумовування, категоризація та аналіз настроїв.
- Сильні навички вирішення проблем та креативність у застосуванні технік NLP до реальних викликів.
- Усвідомлення етичних аспектів у NLP, включаючи упередження, приватність та соціальні впливи.
- Компетентність у всьому процесі науки про дані - від збору даних до їх використання.
- Експертиза у роботі з великими наборами даних, їх аналіз та візуалізація за допомогою таких інструментів, як SQL та Python.
- Досвід роботи з Data Augmentation.
- Знайомство з трансформерами, BERT та розпізнаванням іменованих сутностей (NER).
- Освіта в галузі інженерії даних.
- Досвід роботи з MLOps та сервісами Azure.
- В