Eine Studie der Karl Landsteiner Privatuniversität für Gesundheitswissenschaften belegt die partielle Überlegenheit Künstlicher Intelligenz und physiologischer Bilddaten bei der Klassifikation von Hirntumoren.
Hirntumore lassen sich mittels Magnetresonanztomografie (MRT) zwar gut erkennen, doch ihre exakte Klassifizierung ist so schwer möglich. Genau die ist aber entscheidend für die Wahl der bestmöglichen Behandlungsoptionen. Jetzt hat ein internationales Team unter Leitung der KL Krems Daten moderner MRT-Methoden als Grundlage für Machine Learning (ML)-Protokolle verwendet und den Einsatz Künstlicher Intelligenz zur Klassifizierung von Hirntumoren beurteilt. Dabei zeigte sich, dass in bestimmten Bereichen die Klassifizierung mittels Künstlicher Intelligenz jener durch geschultes Fachpersonal überlegen sein kann.
Die Klassifikation von Hirntumoren – und damit die Wahl der optimalen Therapieoptionen – kann durch den Einsatz Künstlicher Intelligenz in Kombination mit physiologischer Bildgebung genauer und präziser werden. Das ist das Ergebnis einer Studie der Karl Landsteiner Privatuniversität für Gesundheitswissenschaften (KL Krems). Darin wurden Methoden des Multiclass Machine Learnings zur Analyse und Klassifizierung von Hirntumoren anhand von physiologischen Daten aus Magnetresonanztomografien eingesetzt. Die Ergebnisse wurden anschließend mit Klassifizierungen durch menschliches Fachpersonal verglichen. Dabei zeigte sich die Künstliche Intelligenz unter anderem in den Bereichen Genauigkeit, Präzision und Fehlklassifikation überlegen, während das Fachpersonal bei der Sensitivität und Spezifität besser abschnitt.
Enorme Datenmengen
Das Team um Prof. Andreas Stadlbauer, Forscher am Zentralinstitut für medizinische Radiologie-Diagnostik des Universitätsklinikum St. Pölten, nutzte für die Studie sowohl Daten von sogenannter fortgeschrittener (advanced) als auch physiologischer MRT. Beide Methoden liefern erweiterten Einblick in die Struktur und den Stoffwechsel eines Hirntumors und erlauben schon seit längerem eine bessere Klassifizierung. Doch der Preis, der für ein solch differenziertes Bild zu zahlen ist, sind enorme Datenmengen, die es fachkundig zu beurteilen gilt. „Wir haben nun analysiert, ob und wie eine Künstliche Intelligenz mittels ML in die Lage versetzt werden kann, geschultes Fachpersonal bei dieser Herkulesaufgabe zu unterstützen“, erläutert Prof. Stadlbauer „Und die Ergebnisse sind sehr vielversprechend. Wenn es um Genauigkeit, Präzision und das Vermeiden von Fehlklassifikationen geht, dann kann eine Künstliche Intelligenz Hirntumore anhand von MRT-Daten gut klassifizieren.“
Zum Erreichen ihres Ergebnisses trainierte das Team neun bekannte Multiclass ML Algorithmen mit MRT-Daten von 167 früheren Patientinnen und Patienten, die an einem der fünf häufigsten Hirntumore erkrankt waren und bei denen eine exakte Klassifizierung mittels Histologie vorlag. Dabei wurden in einem aufwendigen Protokoll insgesamt 135 sogenannte Classifier generiert. Das sind mathematische Funktionen, die eine Zuordnung des zu untersuchenden Materials in bestimmte Kategorien vornehmen. „Im Unterschied zu vorherigen Studien berücksichtigten wir auch Daten von physiologischen MRTs“, erläutert Prof. Stadlbauer. „Dazu zählten Details zur Gefäßarchitektur der Tumore und deren Bildung neuer Gefäße sowie zur Versorgung des Tumorgewebes mit Sauerstoff.“
Radiophysiomics
Die Kombination der Daten verschiedener MRT-Methoden mit Multiclass ML benannte das Team als „Radiophysiomics“. Ein Begriff, der sich wahrscheinlich rasch etablieren wird, denn das Potenzial dieses Ansatzes zeigte sich im zweiten Teil des Projekts, der Testphase. In dieser wurden die nun trainierten Multiclass ML-Algorithmen mit entsprechenden MRT-Daten von 20 aktuellen Hirntumorpatientinnen und -patienten gespeist und die Ergebnisse der so erzielten Klassifikationen mit jenen zweier zertifizierter Radiologen verglichen. Dabei übertrafen die zwei besten ML Algorithmen (als „adaptive boosting“ und „random forest“ bezeichnet), die Ergebnisse der menschlichen Beurteilung in den Bereichen Genauigkeit und Präzision. Auch führten diese ML-Algorithmen zu weniger Fehlklassifikation als durch das Fachpersonal (5 versus 6). Ging es hingegen um die Sensitivität und Spezifität der Beurteilung, dann erwiesen sich die menschlichen Beurteilungen als treffsicherer als die getestete Künstliche Intelligenz.
„Damit wird auch klar“, meint Prof. Stadlbauer, „dass der ML-Ansatz derzeit noch kein Ersatz, sondern eine Ergänzung für eine Klassifikation durch qualifiziertes Fachpersonal sein sollte. Dazu kommt der aktuell noch sehr hohe Zeit- und Arbeitsaufwand für diesen Ansatz. Doch bietet er eine Möglichkeit, dessen Potenzial es für den klinischen Alltag weiter zu verfolgen gilt.“ Insgesamt zeigt diese Studie erneut den Fokus der Forschung an der KL Krems auf grundlegende Erkenntnisse mit echtem klinischen Mehrwert. (pi/red)