Sr. Ingeniero de Aprendizaje Automático

Job expired!
*Esta posición corresponde al reclutamiento específico para el departamento de AI/ML de Hyperconnect 2023. Por favor, consulta los detalles en nuestra página web (enlace).

El ingeniero de aprendizaje automático (MLE) de Hyperconnect se encarga de identificar y resolver problemas en nuestros servicios de conexión entre personas que son difíciles de abordar con tecnologías existentes, pero que pueden resolverse mediante el aprendizaje automático, impulsando así la innovación de la experiencia del usuario. Para ello, desarrollamos una multitud de modelos en diversos dominios, incluyendo video, audio y texto, y nos esforzamos en resolver los desafíos de investigación que surgen al proporcionar estos modelos de forma estable a través de servidores móviles y en la nube, con el objetivo de contribuir al crecimiento de nuestros servicios reales.

Bajo estos objetivos, los ingenieros de ML de Hyperconnect han estado desarrollando tecnologías de aprendizaje automático que contribuyen a varios productos de Hyperconnect, como Azar y Hakuna, durante varios años, y estamos investigando cómo aplicar fácilmente estas tecnologías acumuladas a diversos servicios empresariales globales.

Como ingenieros de ML, necesitamos tanto la habilidad de investigación para investigar y mejorar los modelos de vanguardia como la habilidad de desarrollo para maximizar el rendimiento de inferencia considerando la complejidad temporal y espacial del modelo. En base a estas habilidades, realizamos una variedad de tareas, tales como identificar y definir problemas que surgen en los servicios reales, replicar o desarrollar modelos SotA para resolver problemas, distribuir modelos en entornos de dispositivos y servidores, y monitorear y mejorar continuamente los modelos. En este proceso, colaboramos activamente y recibimos ayuda de diversas organizaciones especializadas, incluyendo ingenieros de back-end/front-end/DevOps, analistas de datos y gerentes de producto.

• AI in Social Discovery (Blending Research and Production)
• [Cómo funciona el Laboratorio de IA] Entrevista al director de IA - Shurain

También nos esforzamos en compartir los resultados de nuestras investigaciones en forma de documentos o códigos. A menudo, al crear modelos de aprendizaje automático para usar en productos, encontramos que la investigación existente es insuficiente. Todos los participantes del proyecto colaboran para organizar las partes significativas de los resultados de la investigación necesarios para llenar estas carencias, y los publicamos junto con el código, si es posible.

• Investigación para establecer un umbral que cumpla con múltiples estándares de clasificación en el ambiente de moderación, WSDM 2023
• Investigación para aumentar la diversidad semántica en la generación de conversaciones, EMNLP 2022
• Métodos eficaces de aprendizaje en un entorno con ruido de etiquetas elevado, ECCV 2022
• Investigación de chatbots que imitan a un personaje objetivo utilizando solo algunas expresiones del personaje objetivo, NAACL 2022
• Mejora del rendimiento de los modelos de generación de conversación mediante el uso de ejemplos, presentación en el Taller ACL 2022
• Investigación de tecnología de destilación para la clasificación de audio en un entorno móvil, ICASSP
• Método de normalización de características que permite la conservación de importancia para la predicción de la tasa de clics, Mejor artículo del taller ICDM
• Modelo de predicción de la tasa de clics eficiente basado en Tabular Learning, presentación en el taller ICLR 2021
• Investigación sobre cómo utilizar modelos generativos a gran escala para chatbots basados en recuperación eficientes, publicación EMNLP 2021
• Técnica para resolver el problema de reconocimiento visual de cola larga desde el punto de vista del cambio de distribución de etiquetas, publicación CVPR 2021
• Tecnología Text-to-Speech (TTS) a través del aprendizaje de un solo disparo, publicación INTERSPEECH 2020
• Tecnología de reproducción facial a través del aprendizaje de un solo disparo, publicación AAAI 2020
• Modelo de detección de palabras clave (TC-ResNet) que funciona rápidamente en dispositivos móviles, publicación INTERSPEECH 2019
• Modelo de segmentación de imágenes liviano optimizado para entornos móviles (MMNet), cargado en archivos
• Segundo lugar en el concurso de reconocimiento de imagen de bajo consumo (LPIRC) 2018
Para que la investigación de ML progrese bien, es necesario tener una infraestructura bien establecida para el aprendizaje profundo. En Hyperconnect, hemos construido nuestro propio clúster de investigación de aprendizaje profundo para que los ingenieros de ML puedan realizar suficientes experimentos y desarrollo del modelo. Disponemos de diversos equipos en el local, incluyendo un clúster compuesto por 20 DGX-A100 (un total de 160 GPUs A100) para la investigación y el desarrollo. Además, se utilizan activamente diversas herramientas como la línea de producción de Kubeflow y BigQuery para la recopilación y procesamiento de datos y la producción. También trabajamos con varios ingenieros de software (incluyendo back-end, front-end, DevOps, y MLSE) que pueden ayudar a productizar los modelos de ML.


Descripción del trabajo

Hyperconnect se esfuerza en varios frentes para aplicar la tecnología de aprendizaje automático a sus productos. El ingeniero de ML de Hyperconnect trabajará en uno de los siguientes tres campos:
[Recomendación]
Resolviendo varios problemas de recomendación incluidos en el producto, proporcionará una mejor experiencia a los usuarios y contribuirá en última instancia al crecimiento a largo plazo de los ingresos. Estamos buscando personas que puedan resolver los siguientes problemas con nosotros. (Entrevista de Squad)

• Cold-start: problema de recomendación para proporcionar una buena experiencia a los nuevos usuarios (sistema que puede entender las preferencias del usuario incluso con sólo unos pocos datos de fusión, sesiones o recomendaciones basadas en gráficos, banda contextual, etc.)
• Recprocal: problema de recomendación donde ambos usuarios pueden estar satisfechos
• Real-time: problema de recomendación donde se infiere en tiempo real sobre los candidatos a la recomendación que cambian en tiempo real (recomendaciones basadas en sesiones o gráficos, aprendizaje por refuerzo, etc.)
• El problema de la recomendación que representa el trade-off entre varios indicadores objetivo
• El problema de encontrar indicadores objetivo primarios que mejoren los indicadores a largo plazo

[Confianza y Seguridad]
Para proporcionar una experiencia satisfactoria a los usuarios, desarrollamos una variedad de tecnologías y realizamos una investigación que entiende el contenido y utiliza esta información. Aceptamos datos no estructurados compuestos de video, audio y lenguaje natural como entrada, y estamos buscando personas que puedan trabajar con nosotros para resolver los siguientes problemas para extraer información útil que pueda ser utilizada para tomar decisiones. (Entrevista de escuadrón)

• Problemas con los modelos ligeros y la optimización que pueden producir velocidades rápidas en entornos móviles
• Problemas sobre modelos multitarea o multietiqueta eficientes que pueden ajustar la importancia de la etiqueta
• Problemas al usar datos multimodales parciales
• Problemas al detectar usuarios inusuales (por ejemplo, spam/cuentas falsas) en tiempo real basándose en los registros de comportamiento del usuario que llegan en un flujo y los resultados del entendimiento del contenido
• Método de etiquetado eficiente de datos a través del aprendizaje activo o método de selección de conjuntos centrales que pueden reducir los datos necesarios para el aprendizaje del modelo

[Inteligencia Artificial Generativa]
Proporcionamos nuevas experiencias a los usuarios que no existían antes a través de diversos desarrollos de investigación de inteligencia artificial generativa. Creamos herramientas que permiten a los usuarios crear contenido personalizado fácilmente y expresarse dentro del servicio, y desarrollamos nuevas funciones mediante el uso de inteligencia artificial generativa.