Fathom est en mission pour utiliser l'IA afin de comprendre et de structurer les données médicales du monde, en commençant par donner un sens aux téraoctets de notes de cliniciens contenues dans les dossiers de santé électroniques des plus grands systèmes de santé du monde. Notre moteur d'apprentissage profond automatise la traduction des dossiers des patients en codes de facturation utilisés pour le remboursement des prestataires de soins de santé, un processus qui coûte aujourd'hui plus de 15 milliards de dollars par an aux hôpitaux américains et des dizaines de milliards de plus en erreurs et en réclamations refusées. Nous sommes une entreprise financée par des capitaux-risqueurs qui a réalisé un tour de financement de série B pour 46 millions de dollars à la fin de 2022.
Nous recherchons un Ingénieur logiciel principal, données basé à distance en Amérique du Nord pour rejoindre notre équipe et travailler sur des produits de données qui constituent le cœur de notre activité. Nous souhaitons travailler avec des collègues à distance qui sont enthousiastes à l'idée d'apprendre à construire et à soutenir des pipelines d'apprentissage automatique qui ne sont pas seulement évolutifs sur le plan informatique, mais aussi de manière flexible, itérative et orientée vers la collaboration. Si vous êtes un expert en données capable d'unifier les données et de construire des systèmes qui sont évolutifs à la fois d'un point de vue opérationnel et organisationnel, Fathom est une opportunité intéressante à explorer.
Votre rôle et vos responsabilités comprendront :
Le développement d'infrastructures de données pour ingérer, assainir et normaliser un large éventail de données médicales, telles que les dossiers de santé électroniques, les journaux médicaux, les ontologies médicales établies, l'étiquetage participatif et autres entrées humaines
La construction d'interfaces performantes et expressives pour les données
La création d'infrastructures pour nous aider non seulement à augmenter l'ingestion de données, mais également l'apprentissage automatique à grande échelle basé sur le cloud
Nous recherchons un coéquipier ayant :
Plus de 5 ans d'expérience en développement dans un contexte d'entreprise /production
De l'expérience dans la construction de pipelines de données à partir de sources disparates
De l'expérience pratique de la construction et de la mise à l'échelle de grappes de calcul
Une solide compréhension des bases de données et des cadres de traitement de données à grande échelle comme Hadoop ou Spark, et la capacité d'évaluer quels outils utiliser pour le travail
Une combinaison unique de compétences créatives et analytiques aptes à concevoir un système capable de réunir, de former et de tester des dizaines de sources de données sous une ontologie unifiée
Points bonus si vous avez :
La maîtrise du développement de systèmes pour faire ou soutenir l'apprentissage automatique, y compris une expérience de travail avec des kits d'outils de TAL comme Stanford CoreNLP, OpenNLP, et/ou NLTK de Python
De l'expertise dans la manipulation de données de santé et/ou du HIPAA
De l'expérience avec la gestion de l'acquisition et de l'étiquetage de données à grande échelle, par des outils tels qu'Amazon Turk ou DeepDive