Data Scientist - Hyperforce Solutions Engineering

Job expired!

Para obtener la mejor experiencia como candidato, por favor considere postularse a un máximo de tres roles dentro de un período de 12 meses para evitar duplicar esfuerzos.

Acerca de Salesforce

Somos Salesforce, la Compañía del Cliente, impulsando el futuro de los negocios con IA, Datos y CRM. Comprometidos con nuestros valores fundamentales, ayudamos a las empresas de todas las industrias a forjar nuevos caminos y conectarse con los clientes como nunca antes. Te empoderamos para que también seas un Trailblazer: mejorando tu rendimiento, avanzando en tu carrera y haciendo un impacto positivo en el mundo. Si crees en los negocios como una plataforma poderosa para el cambio y en empresas que hacen el bien, has encontrado el lugar correcto.

Únete a Salesforce como Científico de Datos Senior / Científico de Datos en el Área de la Bahía y ayúdanos a revolucionar la productividad del desarrollador con soluciones innovadoras de ciencia de datos. Nuestro equipo se dedica a crear y apoyar productos de aprendizaje automático (ML) como chatbots generativos de IA, búsqueda semántica, herramientas de identificación de errores, paneles de soporte al cliente y más. Tu rol abarcará todo el ciclo de vida de las soluciones de ML, desde la prueba de concepto (POC) hasta el despliegue y el mantenimiento continuo.

El Equipo: Salesforce Hyperforce Solutions Engineering (HSE)

Salesforce HSE desarrolla y aloja la plataforma de entrega continua (CD) y despliegue Falcon. Esto incluye servicios como Spinnaker, PCS, FIT y IAC, junto con el ecosistema que rodea estos servicios. Nuestro equipo de Éxito del Cliente de HDPS ayuda a los ingenieros de Salesforce a adoptar y usar efectivamente los servicios de HDPS para asegurar la integración exitosa, el diagnóstico de problemas, el desarrollo de contenido de formación y la creación de soluciones orientadas al cliente.

Responsabilidades Clave

Desarrollo de Aplicaciones de LLM: Liderar e implementar aplicaciones de LLM utilizando LangChain, enfocándose en transformadores y arquitectura GPT. Mejorar las funcionalidades de la aplicación con LLM, Ingeniería de Prompts, RAG y conceptos de Agentes. Desarrollar agentes de IA conversacional, chatbots o asistentes virtuales y asegurar la integración sin problemas en los sistemas existentes.

Experimentación y Pruebas: Diseñar y llevar a cabo pruebas A/B, analizando los resultados con herramientas estadísticas para optimizar el rendimiento de la aplicación.

Análisis y Visualización de Datos: Desarrollar paneles con herramientas como Tableau y Splunk para hacer que los resultados de los experimentos sean accesibles a los interesados del negocio.

Programación: Utilizar Python y SOQL para la manipulación de datos, análisis y automatización de tareas, asegurando la calidad y el mantenimiento del código.

Investigación y Desarrollo: Mantenerse actualizado con las tendencias de la industria como llamaindex, mistral, LLAMA3 y otros LLM emergentes. Incorporar nuevas tecnologías para mantener la ventaja competitiva.

Colaboración y Liderazgo: Trabajar con equipos multifuncionales para impulsar la innovación, mentorizar a científicos de datos junior y contribuir al intercambio de conocimientos del equipo.

Habilidades Requeridas (Científico de Datos)

* Título de maestría en Ciencias de la Computación, Ingeniería Informática, Estadística, Ciencia de Datos o campos relacionados.

* Mínimo 5 años de experiencia en ciencia de datos, específicamente en aplicaciones de LLM.

* Experiencia en aprendizaje profundo y competencia en marcos de NLP como nltk, PyTorch, TensorFlow, Keras y más.

* Amplia experiencia con transformadores, arquitectura GPT, LangChain, RAG y conceptos de Agentes.

* Habilidades probadas en pruebas A/B, análisis estadístico y herramientas de visualización de datos como Tableau y Splunk.

* Fuerte comprensión de los conceptos de ML y bibliotecas estadísticas como pandas, matplotlib, numpy y sklearn.

* Competencia en lenguajes de consulta, con preferencia por SQL, SOQL o SAQL.

* Experiencia con datos no estructurados y bases de datos NoSQL como MongoDB y Cassandra.

* Familiaridad con bases de datos vectoriales como Pinecone y Weaviate, y gráficos de conocimiento como Neo4j.