Senior Machine Learning Engineer, NLP - (Remote)

Machine learning
Toronto
06/29/2024
-

Job expired!

Estamos buscando activamente un Ingeniero Senior de Aprendizaje Automático - PLN dinámico para unirse a nuestro equipo en expansión de ML en BenchSci. En este rol, abordarás desafíos complejos de PLN que afectan significativamente a más de 41,000 científicos en todo el mundo que dependen de BenchSci para sus investigaciones. Reportando al Gerente de Ingeniería, ML, estamos buscando a un experto en Python, ingeniería de datos y PLN, particularmente con LLMs (como GPT-4, Gemini, Claude) y SLMs (como Mistral, Llama v2 y otros modelos de parámetros <7B). Se considera una ventaja contar con experiencia en el campo biomédico.

Sus principales responsabilidades incluirán:

Diseñar, construir, evaluar y desplegar modelos avanzados de ML, con especial enfoque en PLN y específicamente LLMs y SLMs para mejorar la velocidad y calidad de los resultados de la investigación.
Liderar la integración y ajuste fino de LLMs (como GPT, Gemini, Claude) y SLMs (como Mistral, Llama, Gemma) utilizando técnicas como HyDE, RAG, PEFT, qLORA y LORA para extraer y generar información a partir de conjuntos de datos complejos.
Colaborar con equipos de ingeniería de datos para desarrollar canalizaciones de datos robustas e ingenieros de infraestructura para desplegar sistemas de PLN escalables y eficientes en entornos de producción.
Mantenerse a la vanguardia en el campo investigando e implementando técnicas innovadoras en PLN y optimizando los flujos de trabajo de ML utilizando avances en herramientas como PyTorch y DVC.
Impulsar discusiones técnicas, aplicar las mejores prácticas en ML y PLN, y liderar la resolución de problemas para asegurar soluciones de alta calidad.
Tomar responsabilidad de estrategias técnicas a largo plazo que fomenten la innovación y avancen la misión de la empresa.
Interactuar con equipos multifuncionales, incluidos científicos de I+D y el Director Científico, para comprender y modelar complejidades biológicas, contribuyendo al intercambio interdisciplinario de conocimientos.
Liderar y contribuir a prácticas ágiles como la planificación de sprints, estimación, diseño y revisiones de código para mantener un proceso de desarrollo robusto.
Mentorear a ingenieros junior, promoviendo una cultura de aprendizaje y excelencia, y estableciendo las mejores prácticas de la industria en el desarrollo de sistemas de ML y PLN.

El candidato ideal tendrá:

Más de 5 años de experiencia aplicando técnicas avanzadas de ML y PLN, con un historial comprobado en el despliegue de sistemas listos para producción.
Competencia experta en Python y conceptos básicos de programación, con amplia experiencia en tecnologías y marcos de PLN como PyTorch.
Familiaridad demostrada con LLMs (GPT, Gemini, Claude) y SLMs (Mistral, Llama, Gemma) en trabajos o proyectos recientes.
Fuertes habilidades en ingeniería de datos, incluida la manipulación y procesamiento con SQL, pandas o tecnologías similares, y experiencia en técnicas de ajuste fino como HyDE, RAG, PEFT, qLORA y LORA.
Un aprendiz continuo con una mentalidad de crecimiento, siempre buscando avanzar en habilidades y conocimientos en el campo en evolución de ML y PLN.
Excelentes habilidades de comunicación y colaboración, con experiencia trabajando de manera multifuncional con equipos técnicos y no técnicos para impulsar soluciones innovadoras.
Bonus: Investigaciones publicadas o literatura en el campo del aprendizaje automático o procesamiento del lenguaje natural es una ventaja, pero no es obligatorio.

En BenchSci, ofrecemos:

Una cultura comprometida que prioriza el trabajo remoto
Un paquete de compensación competitivo que incluye opciones de acciones de BenchSci
Una política de vacaciones sólida más un día adicional de vacaciones cada año
Cierres de la empresa por 14 días adicionales a lo largo del año
Tiempo flexible para días por enfermedad, días personales y días festivos religiosos
Beneficios médicos y dentales integrales
Un presupuesto anual para aprendizaje y desarrollo