Data Trainer / Data Scientist - Machine Learning & NLP en MindTech
MindTech, pionero en ofrecer soluciones integrales de seguridad y cumplimiento de datos, está en busca de un Data Trainer / Data Scientist especializado en Machine Learning y NLP con experiencia. Nuestro candidato ideal prospera en un ambiente de alta tecnología, dando forma a conjuntos de datos de alta calidad para mejorar las soluciones basadas en datos en diversos dominios empresariales.
Descripción del Rol:
El Data Trainer / Data Scientist será clave en la generación y gestión de conjuntos de datos robustos utilizados por desarrolladores de IA/software, equipos de QA e ingenieros de campo. Esta posición se centra principalmente en crear y mantener conjuntos de datos que contienen información personal identificable, crucial para el entrenamiento de modelos de IA y la facilitación de pruebas de QA. Aunque el objetivo principal no es desarrollar nuevos modelos, las capacidades en modelado se considerarán una adición valiosa.
Antigüedad:
Buscamos un miembro senior del equipo que pueda operar de manera independiente e inyectar creatividad en nuestras operaciones, mejorando nuestras ofertas empresariales y soluciones de datos.
Responsabilidades Clave:
- Desarrollo de conjuntos de datos representativos que imiten los datos de los clientes para módulos de entrenamiento, ayudando a los equipos de QA y desarrollo.
- Extracción de elementos de datos sensibles adaptados a requisitos específicos de productos y clientes.
Requisitos:
- Historial probado en el desarrollo de complejas canalizaciones ETL, particularmente aquellas que manejan texto y patrones de lenguaje natural.
- Experiencia en Python y herramientas como pandas, numpy, Gensim, spaCy, NLTK; competencia con bases de datos SQL y NoSQL.
- Diligencia demostrada en la calidad de datos y una profunda comprensión de las diversas necesidades empresariales.
- Habilidad para escribir código modular y participar en entornos colaborativos incluyendo revisiones de código.
- Experiencia en la interacción con desarrolladores de software, gerentes de producto y otros stakeholders para integrar soluciones de datos y refinar los requisitos empresariales.
- Fuertes habilidades de comunicación con una inclinación por la documentación clara y organizada de software y datos.
Deseable tener:
- Experiencia con canalizaciones de análisis de texto y modelos de aprendizaje automático enfocados en la clasificación de texto y detección de entidades.
- Interés o antecedentes en web scraping, creación automatizada de contenido, ciclos de vida de ML o AI, ci/cd pipelines y MLOps.
- Curiosidad y afán por mantenerse informado sobre las últimas tendencias de la industria en machine learning e inteligencia artificial.
Otras Tecnologías:
- Experiencia con Modelos de Lenguaje de Gran Tamaño (MLG) aplicados en escenarios empresariales reales, especialmente en generación de contenido o datos.
- Conocimiento de plataformas de computación en la nube como Google Cloud y AWS es preferible.
Beneficios:
Únete a MindTech y disfruta de un ambiente amigable y profesional con beneficios como una laptop de alta gama o estación de trabajo, acceso a la plataforma de bienestar "Rozumi" para ti y tu familia, licencia por enfermedad pagada, días de vacaciones y feriados nacionales. Estamos comprometidos con tu crecimiento profesional y el avance de tu carrera.
Sobre el Proyecto:
Nuestro producto ofrece un catálogo maestro preciso del uso de datos sensibles, permitiendo a las empresas gestionar la seguridad de los datos y el cumpl