Data Trainer - Machine Learning & NLP

Job expired!

Data Trainer / Data Scientist - Machine Learning & NLP en MindTech

MindTech, pionero en ofrecer soluciones integrales de seguridad y cumplimiento de datos, está en busca de un Data Trainer / Data Scientist especializado en Machine Learning y NLP con experiencia. Nuestro candidato ideal prospera en un ambiente de alta tecnología, dando forma a conjuntos de datos de alta calidad para mejorar las soluciones basadas en datos en diversos dominios empresariales.

Descripción del Rol:

El Data Trainer / Data Scientist será clave en la generación y gestión de conjuntos de datos robustos utilizados por desarrolladores de IA/software, equipos de QA e ingenieros de campo. Esta posición se centra principalmente en crear y mantener conjuntos de datos que contienen información personal identificable, crucial para el entrenamiento de modelos de IA y la facilitación de pruebas de QA. Aunque el objetivo principal no es desarrollar nuevos modelos, las capacidades en modelado se considerarán una adición valiosa.

Antigüedad:

Buscamos un miembro senior del equipo que pueda operar de manera independiente e inyectar creatividad en nuestras operaciones, mejorando nuestras ofertas empresariales y soluciones de datos.

Responsabilidades Clave:

  • Desarrollo de conjuntos de datos representativos que imiten los datos de los clientes para módulos de entrenamiento, ayudando a los equipos de QA y desarrollo.
  • Extracción de elementos de datos sensibles adaptados a requisitos específicos de productos y clientes.

Requisitos:

  • Historial probado en el desarrollo de complejas canalizaciones ETL, particularmente aquellas que manejan texto y patrones de lenguaje natural.
  • Experiencia en Python y herramientas como pandas, numpy, Gensim, spaCy, NLTK; competencia con bases de datos SQL y NoSQL.
  • Diligencia demostrada en la calidad de datos y una profunda comprensión de las diversas necesidades empresariales.
  • Habilidad para escribir código modular y participar en entornos colaborativos incluyendo revisiones de código.
  • Experiencia en la interacción con desarrolladores de software, gerentes de producto y otros stakeholders para integrar soluciones de datos y refinar los requisitos empresariales.
  • Fuertes habilidades de comunicación con una inclinación por la documentación clara y organizada de software y datos.

Deseable tener:

  • Experiencia con canalizaciones de análisis de texto y modelos de aprendizaje automático enfocados en la clasificación de texto y detección de entidades.
  • Interés o antecedentes en web scraping, creación automatizada de contenido, ciclos de vida de ML o AI, ci/cd pipelines y MLOps.
  • Curiosidad y afán por mantenerse informado sobre las últimas tendencias de la industria en machine learning e inteligencia artificial.

Otras Tecnologías:

  • Experiencia con Modelos de Lenguaje de Gran Tamaño (MLG) aplicados en escenarios empresariales reales, especialmente en generación de contenido o datos.
  • Conocimiento de plataformas de computación en la nube como Google Cloud y AWS es preferible.

Beneficios:

Únete a MindTech y disfruta de un ambiente amigable y profesional con beneficios como una laptop de alta gama o estación de trabajo, acceso a la plataforma de bienestar "Rozumi" para ti y tu familia, licencia por enfermedad pagada, días de vacaciones y feriados nacionales. Estamos comprometidos con tu crecimiento profesional y el avance de tu carrera.

Sobre el Proyecto:

Nuestro producto ofrece un catálogo maestro preciso del uso de datos sensibles, permitiendo a las empresas gestionar la seguridad de los datos y el cumpl