¡Únete a un líder global en transformación digital! En CI&T, colaboramos con las marcas más prestigiosas del mundo para crear soluciones digitales innovadoras que revolucionan los negocios. Con un legado de 29 años impulsando el impacto empresarial, nuestro equipo de más de 6,000 profesionales en todo el mundo se especializa en estrategia, investigación, ciencia de datos, diseño e ingeniería para fomentar el crecimiento, mejorar la experiencia del cliente y optimizar la eficiencia operativa.
CI&T está buscando Científicos de Datos experimentados con experiencia en Procesamiento de Lenguaje Natural (PLN) para liderar iniciativas de IA en la industria de la salud en América. Como un jugador clave, impulsarás el impacto empresarial utilizando soluciones de IA de vanguardia.
- Realizar exploración de datos para validar los requisitos y la calidad de los datos en contextos de PLN.
- Ejecutar el preprocesamiento de PLN, incluyendo Tokenización, Análisis Léxico, Análisis Sintáctico, Análisis Semántico y Análisis Pragmático.
- Definir y alinear los mejores modelos de PLN con los resultados esperados del negocio.
- Entrenar y validar modelos utilizando métricas como precisión, exactitud, recuerdo, puntuación F1 y puntuación ROUGE.
- Documentar los procesos de desarrollo de modelos, metodologías y resultados para todas las partes interesadas.
- Implementar clasificación de textos y análisis de sentimientos utilizando clasificadores de aprendizaje automático tradicionales y modelos de aprendizaje profundo.
- Mejorar el rendimiento del modelo de PLN mediante rigurosos experimentos y análisis.
- Emplear técnicas de modelado de temas como LDA y NMF para descubrir temas abstractos a partir de datos de texto.
- Comprender y aplicar modelos de secuencia a secuencia para tareas de traducción automática, resumen de textos y respuesta a preguntas.
- Habilidades de comunicación oral y escrita en inglés.
- Experiencia con proyectos internacionales y como Científico de Datos en proyectos de PLN.
- Experiencia en Python, centrada en paquetes como NLTK, spaCy y Gensim.
- Experiencia con técnicas como Extracción de Temas, Resumen, Categorización y Análisis de Sentimientos.
- Fuertes habilidades para resolver problemas y creatividad en la aplicación de técnicas de PLN a desafíos del mundo real.
- Conciencia de las consideraciones éticas en PLN, incluyendo sesgos, privacidad e impactos sociales.
- Competencia a lo largo del pipeline de ciencia de datos, desde la recopilación de datos hasta la implementación.
- Experiencia en el manejo, análisis y visualización de grandes conjuntos de datos utilizando herramientas como SQL y Python.
- Experiencia con Aumento de Datos.
- Familiaridad con Transformers, BERT y Reconocimiento de Entidades Nombradas (NER).
- Antecedentes en ingeniería de datos.
- Experiencia con MLOps y servicios de Azure.
- Competencia con Databricks.
- Conocimiento de regulaciones de protección de datos como PII, CCPA y HIPAA.
- Planes de salud y dental.
- Subsidios de comida.
- Asistencia de cuidado infantil.
- Licencia parental extendida.
- Gympass.
- Participación en las ganancias anuales.
- Seguro de vida.
- Acceso a una plataforma de salud mental en línea.
- Universidad CI&T.
- Club de descuentos.
- Programas de apoyo: legal, financiero, fisioterapia, orientación psicológica, nutricionista y más.
- Curso de embarazo y paternidad responsable.
- Convenios con plataformas de cursos en línea.
- Plataforma de aprendizaje de idiomas.
- Y muchos más.
#LI-JP3 #Midsenior