Estamos buscando activamente un Ingeniero Senior de Aprendizaje Automático - PLN dinámico para unirse a nuestro equipo en expansión de ML en BenchSci. En este rol, abordarás desafíos complejos de PLN que afectan significativamente a más de 41,000 científicos en todo el mundo que dependen de BenchSci para sus investigaciones. Reportando al Gerente de Ingeniería, ML, estamos buscando a un experto en Python, ingeniería de datos y PLN, particularmente con LLMs (como GPT-4, Gemini, Claude) y SLMs (como Mistral, Llama v2 y otros modelos de parámetros <7B). Se considera una ventaja contar con experiencia en el campo biomédico.
Sus principales responsabilidades incluirán:
- Diseñar, construir, evaluar y desplegar modelos avanzados de ML, con especial enfoque en PLN y específicamente LLMs y SLMs para mejorar la velocidad y calidad de los resultados de la investigación.
- Liderar la integración y ajuste fino de LLMs (como GPT, Gemini, Claude) y SLMs (como Mistral, Llama, Gemma) utilizando técnicas como HyDE, RAG, PEFT, qLORA y LORA para extraer y generar información a partir de conjuntos de datos complejos.
- Colaborar con equipos de ingeniería de datos para desarrollar canalizaciones de datos robustas e ingenieros de infraestructura para desplegar sistemas de PLN escalables y eficientes en entornos de producción.
- Mantenerse a la vanguardia en el campo investigando e implementando técnicas innovadoras en PLN y optimizando los flujos de trabajo de ML utilizando avances en herramientas como PyTorch y DVC.
- Impulsar discusiones técnicas, aplicar las mejores prácticas en ML y PLN, y liderar la resolución de problemas para asegurar soluciones de alta calidad.
- Tomar responsabilidad de estrategias técnicas a largo plazo que fomenten la innovación y avancen la misión de la empresa.
- Interactuar con equipos multifuncionales, incluidos científicos de I+D y el Director Científico, para comprender y modelar complejidades biológicas, contribuyendo al intercambio interdisciplinario de conocimientos.
- Liderar y contribuir a prácticas ágiles como la planificación de sprints, estimación, diseño y revisiones de código para mantener un proceso de desarrollo robusto.
- Mentorear a ingenieros junior, promoviendo una cultura de aprendizaje y excelencia, y estableciendo las mejores prácticas de la industria en el desarrollo de sistemas de ML y PLN.
El candidato ideal tendrá:
- Más de 5 años de experiencia aplicando técnicas avanzadas de ML y PLN, con un historial comprobado en el despliegue de sistemas listos para producción.
- Competencia experta en Python y conceptos básicos de programación, con amplia experiencia en tecnologías y marcos de PLN como PyTorch.
- Familiaridad demostrada con LLMs (GPT, Gemini, Claude) y SLMs (Mistral, Llama, Gemma) en trabajos o proyectos recientes.
- Fuertes habilidades en ingeniería de datos, incluida la manipulación y procesamiento con SQL, pandas o tecnologías similares, y experiencia en técnicas de ajuste fino como HyDE, RAG, PEFT, qLORA y LORA.
- Un aprendiz continuo con una mentalidad de crecimiento, siempre buscando avanzar en habilidades y conocimientos en el campo en evolución de ML y PLN.
- Excelentes habilidades de comunicación y colaboración, con experiencia trabajando de manera multifuncional con equipos técnicos y no técnicos para impulsar soluciones innovadoras.
- Bonus: Investigaciones publicadas o literatura en el campo del aprendizaje automático o procesamiento del lenguaje natural es una ventaja, pero no es obligatorio.
En BenchSci, ofrecemos:
- Una cultura comprometida que prioriza el trabajo remoto
- Un paquete de compensación competitivo que incluye opciones de acciones de BenchSci
- Una política de vacaciones sólida más un día adicional de vacaciones cada año
- Cierres de la empresa por 14 días adicionales a lo largo del año
- Tiempo flexible para días por enfermedad, días personales y días festivos religiosos
- Beneficios médicos y dentales integrales
- Un presupuesto anual para aprendizaje y desarrollo