Fathom est en mission pour utiliser l'IA afin de comprendre et structurer les données médicales du monde, en commençant par donner un sens aux téraoctets de notes de cliniciens contenues dans les dossiers de santé électroniques des plus grands systèmes de santé mondiaux. Notre moteur d'apprentissage profond automatise la traduction des dossiers des patients en codes de facturation utilisés pour le remboursement des prestataires de soins de santé, un processus qui coûte actuellement aux hôpitaux américains plus de 15 milliards de dollars par an et des dizaines de milliards de plus en erreurs et en refus de paiement. Nous sommes une entreprise financée par des fonds de capital-risque qui a clôturé un tour de financement de série B de 46 millions de dollars fin 2022.
Nous recherchons un Ingénieur Logiciel, Data pour travailler sur les produits de données qui alimentent le cœur de notre activité. Nous souhaitons travailler avec des collègues basés à distance en Amérique du Nord, qui sont enthousiastes à l'idée d'apprendre à construire et à soutenir des pipelines d'apprentissage automatique qui évoluent non seulement en termes de calcul, mais aussi de manière flexible, itérative et axée sur la collaboration. Si vous êtes un expert en données capable de rassembler des données et de construire des systèmes qui évoluent à la fois d'un point de vue opérationnel et d'un point de vue organisationnel, Fathom est une opportunité intéressante à explorer.
Votre rôle et vos responsabilités comprendront :
Développement d'une infrastructure de données pour ingérer, assainir et normaliser un large éventail de données médicales, tels que les dossiers de santé électroniques, les revues, les ontologies médicales établies, l'étiquetage participatif et d'autres entrées humaines
Construction d'interfaces performantes et expressives vers les données
Création d'une infrastructure pour nous aider non seulement à augmenter l'ingestion de données, mais aussi l'apprentissage automatique à grande échelle basé sur le cloud
Nous recherchons un(e) collègue qui a :
Plus de 2 ans d'expérience en ingénierie logicielle dans un cadre d'entreprise/production
Connaissance des algorithmes, des structures de données et de la conception de systèmes
Expérience de la construction de pipelines de données à partir de sources disparates
Expérience pratique de la construction et de la montée en charge de clusters de calcul
Une solide compréhension des bases de données et des cadres de traitement de données à grande échelle comme Hadoop ou Spark et la capacité d'évaluer quels outils utiliser pour le travail
Une combinaison unique de compétences créatives et analytiques aptes à concevoir un système capable de rassembler, de former et de tester des dizaines de sources de données sous une ontologie unifiée
Points bonus si vous avez :
Connaissance du développement de systèmes pour faire ou soutenir l'apprentissage automatique, y compris l'expérience de travail avec des outils NLP comme Stanford CoreNLP, OpenNLP, et/ou NLTK de Python
Expertise dans la manipulation de données de santé et/ou le respect du HIPAA
Expérience de la gestion de l'étiquetage et de l'acquisition de données à grande échelle, grâce à des outils tels que Amazon Turk ou DeepDive