Josh Miller ist CEO von Gradient Health, einem Unternehmen, das auf der Idee gegründet wurde, dass es eine automatisierte Diagnostik geben muss, damit die Gesundheitsversorgung gerecht und für alle verfügbar ist. Gradient Health zielt darauf ab, automatisierte KI zu beschleunigen. Diagnostik mit Daten, die organisiert, gekennzeichnet und verfügbar sind.
Können Sie die Entstehungsgeschichte von Gradient Health erzählen?
Mein Mitbegründer Ouwen und ich waren gerade ausgestiegen unser erstes Start-up, FarmShots, das mithilfe von Computer Vision dazu beitrug, die Menge der in der Landwirtschaft verwendeten Pestizide zu reduzieren, und wir suchten nach unserer nächsten Herausforderung.
Wir waren schon immer von dem Wunsch motiviert, ein schwieriges Problem zu finden, das mit Technologie gelöst werden kann, das a) die Möglichkeit hat, a viel Gutes auf der Welt und b) führt zu einem soliden Geschäft. Ouwen arbeitete an seinem Medizinstudium, und mit unserer Erfahrung im Bereich Computer Vision war die medizinische Bildgebung eine natürliche Ergänzung für uns. Aufgrund der verheerenden Auswirkungen von Brustkrebs haben wir uns für die Mammographie als mögliche Erstanwendung entschieden. Also sagten wir: „Okay, wo fangen wir an? Wir brauchen Daten. Wir brauchen tausend Mammogramme. Woher bekommen Sie diese Datenmenge?“ und die Antwort war „Nirgendwo“. Uns wurde sofort klar, dass es wirklich schwierig ist, Daten zu finden. Nach Monaten wurde diese Frustration für uns zu einem philosophischen Problem, wir dachten: „Jeder, der versucht, in diesem Bereich Gutes zu tun, sollte nicht kämpfen und kämpfen müssen, um die Daten zu erhalten, die er zum Erstellen lebensrettender Algorithmen benötigt.“ Und so sagten wir: „Hey, vielleicht ist das tatsächlich unser Problem, das wir lösen müssen.“
Welche Risiken bestehen derzeit auf dem Markt mit nicht repräsentativen Daten?
Von unzähligen Studien und Beispielen aus der Praxis wissen wir, dass es einfach nicht funktionieren wird, wenn wir einen Algorithmus nur mit Daten von der Westküste erstellen und ihn in den Südosten bringen. Immer wieder hören wir Geschichten von KI, die in dem nordöstlichen Krankenhaus, in dem sie entwickelt wurde, hervorragend funktioniert, und wenn sie dann anderswo eingesetzt wird, sinkt die Genauigkeit auf weniger als 50 %.
Ich glaube an den grundlegenden Zweck der KI , auf ethischer Ebene, ist, dass es gesundheitliche Diskrepanzen verringern sollte. Ziel ist es, qualitativ hochwertige Pflege für alle erschwinglich und zugänglich zu machen. Aber das Problem ist, wenn Sie es auf schlechten Daten aufbauen, erhöhen Sie tatsächlich die Diskrepanzen. Wir scheitern an der Mission der KI im Gesundheitswesen, wenn wir sie nur für Weiße von den Küsten arbeiten lassen. Menschen mit unterrepräsentiertem Hintergrund werden dadurch tatsächlich mehr und nicht weniger diskriminiert.
Können Sie erörtern, wie Gradient Health Daten bezieht?
Sicher, wir sind Partner mit allen Arten von Gesundheitssystemen auf der ganzen Welt, deren Daten sonst gespeichert werden, was sie Geld kostet und niemandem nützt. Wir de-identifizieren ihre Daten gründlich an der Quelle und organisieren sie dann sorgfältig für Forscher.
Wie stellt Gradient Health sicher, dass die Daten unvoreingenommen und so vielfältig wie möglich sind?
Es gibt viele Möglichkeiten. Wenn wir beispielsweise Daten sammeln, stellen wir sicher, dass wir viele kommunale Kliniken, in denen Sie oft viel repräsentativere Daten haben, sowie die größeren Krankenhäuser einbeziehen. Wir beziehen unsere Daten auch von einer großen Anzahl klinischer Standorte. Wir versuchen, so viele Websites wie möglich von einer möglichst breiten Bevölkerungsgruppe zu erhalten. Also nicht nur eine große Anzahl von Standorten, sondern auch geografisch und sozioökonomisch vielfältig. Denn wenn alle Ihre Standorte alle aus Krankenhäusern in der Innenstadt stammen, sind das immer noch keine repräsentativen Daten, oder?
Um all dies zu validieren, führen wir Statistiken über alle diese Datensätze aus und passen sie für den Kunden an, um sie zu erstellen sicher, dass sie Daten erhalten, die in Bezug auf Technologie und Demografie vielfältig sind.
Warum ist dieses Maß an Datenkontrolle so wichtig, um robuste KI-Algorithmen zu entwickeln?
Es gibt viele Variablen, denen eine KI in der realen Welt begegnen könnte, und unser Ziel ist es sicherzustellen, dass der Algorithmus so robust wie möglich ist. Um die Dinge zu vereinfachen, denken wir an fünf Schlüsselvariablen in unseren Daten. Die erste Variable, an die wir denken, ist „Gerätehersteller“. Es ist offensichtlich, aber wenn Sie einen Algorithmus nur mit Daten von GE-Scannern erstellen, wird er beispielsweise auf einem Hitachi nicht so gut funktionieren.
In ähnlicher Weise gibt es die Variable „Gerätemodell“. Dieser ist aus Sicht der gesundheitlichen Ungleichheit eigentlich recht interessant. Wir wissen, dass die großen, gut finanzierten Forschungskrankenhäuser in der Regel über die neuesten und besten Versionen von Scannern verfügen. Und wenn sie ihre KI nur auf ihren eigenen 2022er-Modellen trainieren, wird es auf einem älteren 2010er-Modell nicht so gut funktionieren. Diese älteren Systeme sind genau die, die in weniger wohlhabenden und ländlichen Gebieten zu finden sind. Indem sie also nur Daten aus neueren Modellen verwenden, führen sie unbeabsichtigt weitere Vorurteile gegenüber Menschen aus diesen Gemeinschaften ein.
Die anderen Schlüsselvariablen sind Geschlecht, ethnische Zugehörigkeit und Alter, und wir unternehmen große Anstrengungen, um dies sicherzustellen unsere Daten sind für alle proportional ausgewogen.
Welchen regulatorischen Hürden sehen sich MedTech-Unternehmen gegenüber?
Wir sehen langsam die FDA Bias in Datensätzen wirklich untersuchen. Wir hatten Forscher, die zu uns kamen und sagten: „Die FDA hat unseren Algorithmus abgelehnt, weil ihm 15 % der afroamerikanischen Bevölkerung fehlten“ (der ungefähre Prozentsatz der Afroamerikaner, die Teil der US-Bevölkerung sind). Wir haben auch von einem Entwickler gehört, dem gesagt wurde, dass er 1 % pazifische hawaiianische Inselbewohner in seine Trainingsdaten aufnehmen muss.
Also beginnt die FDA zu erkennen, dass diese Algorithmen, die gerade erst trainiert wurden, an einem einzigen Krankenhaus, nicht in der realen Welt arbeiten. Tatsache ist, dass Sie, wenn Sie eine CE-Kennzeichnung und eine FDA-Zulassung wünschen, einen Datensatz haben müssen, der die Bevölkerung repräsentiert. Es ist zu Recht nicht mehr akzeptabel, eine KI an einer kleinen oder nicht repräsentativen Gruppe zu trainieren.
Das Risiko für MedTechs besteht darin, dass sie Millionen von Dollar investieren, um ihre Technologie an einen Ort zu bringen, an dem sie glauben, dass sie es sind bereit für die behördliche Genehmigung, und wenn sie es dann nicht schaffen, werden sie niemals eine Erstattung oder Einnahmen erhalten. Letztendlich erfordert der Weg zur Kommerzialisierung und der Weg zu den positiven Auswirkungen auf die Gesundheitsversorgung, die sie haben möchten, dass sie sich um Datenverzerrung kümmern.
Was sind einige der Optionen, um diese zu überwinden Hürden aus Datensicht?
In den letzten Jahren haben sich die Datenverwaltungsmethoden weiterentwickelt, und KI-Entwicklern stehen jetzt mehr Optionen zur Verfügung als je zuvor. Von Datenvermittlern und-partnern bis hin zu föderiertem Lernen und synthetischen Daten gibt es neue Ansätze für diese Hürden. Welche Methode sie auch wählen, wir ermutigen Entwickler immer zu prüfen, ob ihre Daten wirklich repräsentativ für die Bevölkerung sind, die das Produkt verwenden wird. Dies ist bei weitem der schwierigste Aspekt bei der Datenbeschaffung.
Eine Lösung, die Gradient Health anbietet, ist Gradient Label. Was ist diese Lösung und wie ermöglicht sie die Kennzeichnung von Daten in großem Maßstab?
KI für medizinische Bildgebung erfordert nicht nur Daten, sondern auch Anmerkungen von Experten. Und wir helfen Unternehmen, diese Expertenkommentare zu erhalten, auch von Radiologen.
Was ist Ihre Vision für die Zukunft von KI und Daten im Gesundheitswesen?
Die gibt es bereits Tausende von KI-Tools da draußen, die sich alles ansehen, von den Fingerspitzen bis zu den Zehenspitzen, und ich denke, das wird so weitergehen. Ich denke, es wird mindestens 10 Algorithmen für jede Krankheit in einem medizinischen Lehrbuch geben. Jeder wird über mehrere, wahrscheinlich wettbewerbsfähige Tools verfügen, die Ärzten helfen, die beste Versorgung zu bieten.
Ich glaube nicht, dass wir am Ende einen Tricorder im Star Trek-Stil sehen werden, der jemanden scannt und Adressen scannt alle möglichen Probleme von Kopf bis Fuß. Stattdessen haben wir spezielle Anwendungen für jede Teilmenge.
Gibt es noch etwas, das Sie über Gradient Health mitteilen möchten?
Ich gespannt auf die Zukunft. Ich denke, wir bewegen uns auf einen Ort zu, an dem die Gesundheitsversorgung kostengünstig, gleich und für alle verfügbar ist, und ich bin sehr daran interessiert, dass Gradient die Chance bekommt, eine grundlegende Rolle dabei zu spielen, dies zu erreichen. Das gesamte Team hier glaubt wirklich an diese Mission, und es gibt eine gemeinsame Leidenschaft, die Sie nicht in jedem Unternehmen finden. Und ich liebe es!
Vielen Dank für das großartige Interview. Leser, die mehr erfahren möchten, sollten Gradient Health besuchen. p>