Dlaczego osteosarcoma wymaga nowoczesnych strategii terapeutycznych?
Osteosarcoma, najczęstszy złośliwy guz kości u dzieci i młodzieży, stanowi około 5% wszystkich nowotworów wieku dziecięcego. Choroba ta najczęściej występuje w drugiej dekadzie życia, z największą częstością między 15 a 19 rokiem życia. Guz pierwotnie rozwija się w metafizach kości długich, najczęściej zajmując dystalną część kości udowej, proksymalną część kości piszczelowej i kość ramienną. Osteosarcoma charakteryzuje się szczególnie agresywnym przebiegiem ze względu na szybką proliferację komórek nowotworowych i wczesne tworzenie przerzutów, najczęściej do płuc. Mimo postępów w technikach chirurgicznych i wprowadzenia wielomodalnych schematów chemioterapii, które zwykle obejmują takie leki jak doksorubicyna, cisplatyna i wysokodawkowy metotreksat, rokowanie dla pacjentów z przerzutową postacią choroby pozostaje niekorzystne – pięcioletnie przeżycie wynosi mniej niż 30%, w porównaniu do około 70% w przypadku choroby zlokalizowanej.
Wysokodawkowy metotreksat (HD-MTX) stanowi podstawę leczenia osteosarcomy, działając jako silny inhibitor reduktazy dihydrofolianowej, co prowadzi do zaburzenia syntezy nukleotydów i hamowania proliferacji komórek nowotworowych. Standardowe dawkowanie HD-MTX waha się od 8 do 12 g/m², podawane wraz z innymi lekami chemioterapeutycznymi w celu maksymalizacji skuteczności terapeutycznej. To wielolekowe podejście zwiększa prawdopodobieństwo osiągnięcia całkowitej remisji i zmniejszenia ryzyka nawrotu. Chociaż HD-MTX jest skuteczny, wiąże się z istotnymi działaniami niepożądanymi, w tym nefrotoksycznością, zapaleniem błon śluzowych i mielosupresją. Te zagrożenia wymagają ścisłego monitorowania stężenia leku, szczególnie ze względu na wąski indeks terapeutyczny metotreksatu.
Jak nowoczesne technologie wspierają monitorowanie i personalizację leczenia?
Terapeutyczne monitorowanie leków (TDM) ma kluczowe znaczenie dla optymalizacji dawkowania, ponieważ indywidualne dostosowania mogą pomóc utrzymać stężenie leku w oknie terapeutycznym przy jednoczesnej minimalizacji toksyczności. Niedawne badania sugerują, że TDM dla HD-MTX może poprawić wyniki leczenia pacjentów poprzez umożliwienie modyfikacji dawki w oparciu o dane farmakokinetyczne w czasie rzeczywistym. Jednak tradycyjne podejścia farmakokinetyczne (PK) często opierają się na średnich populacyjnych, które mogą nie odzwierciedlać dokładnie indywidualnej zmienności pacjenta. Ponadto, powodzenie zastosowania modelu PK w dużej mierze zależy od dokładności i kompleksowości parametrów modelu, ale pozyskiwanie parametrów modelu jest ograniczone przez metody analizy biochemicznej i zazwyczaj trudne. To ograniczenie podkreśla potrzebę innowacyjnych strategii w celu zwiększenia precyzji dawkowania.
Integracja uczenia maszynowego (ML) w onkologii i farmaceutyce stanowi transformacyjne podejście do personalizacji strategii leczenia. Algorytmy uczenia maszynowego mogą analizować złożone zbiory danych w celu identyfikacji wzorców i przewidywania odpowiedzi pacjentów na terapie, co znacząco wpływa na podejmowanie decyzji klinicznych. W kontekście osteosarcomy, ML wykazało użyteczność w przewidywaniu odpowiedzi na leczenie, identyfikacji biomarkerów progresji choroby i poprawie stratyfikacji pacjentów pod kątem prawdopodobieństwa sukcesu terapeutycznego.
Na przykład, zaawansowane techniki ML, takie jak maszyny wektorów nośnych, lasy losowe i algorytmy głębokiego uczenia, zostały wykorzystane do przewidywania ogólnego przeżycia i odpowiedzi na leczenie lekami poprzez analizę różnorodnych danych klinicznych, genomicznych i proteomicznych. W kontekście TDM, stężenie leków i ich metabolitów w osoczu/surowicy może lepiej przewidzieć kliniczną ciężkość i potencjalne wyniki przypadków w porównaniu do zakładanego spożycia i czasu. Istnieją badania nad uczeniem maszynowym dotyczące przewidywania stężenia leków we krwi kilku rodzajów leków, w tym antykoagulantów, leków przeciwpsychotycznych, przeciwpadaczkowych, antybiotyków i immunosupresantów. Modele te mogą przetwarzać ogromne ilości informacji, identyfikując subtelne interakcje i korelacje, które tradycyjne metody statystyczne mogą przeoczyć.
Jakie wyzwania metodyczne stoją za analizą terapii HD-MTX?
Niniejsze badanie miało na celu identyfikację czynników znacząco wpływających na stężenie metotreksatu we krwi poprzez analizę danych medycznych metodami uczenia maszynowego oraz opracowanie predykcyjnego modelu regresji dla stężenia MTX we krwi u pacjentów z osteosarcomą otrzymujących chemioterapię wysokodawkową, aby wspomóc podejmowanie decyzji klinicznych.
W retrospektywnej analizie uwzględniono dane 68 pacjentów z osteosarcomą, którzy otrzymali schemat wysokodawkowego metotreksatu w Szpitalu Onkologicznym Prowincji Liaoning między lipcem 2020 a sierpniem 2022 roku. Protokół i plan badania były zgodne ze standardami przeglądu etycznego Szpitala Onkologicznego Prowincji Liaoning (Numer zatwierdzenia: KT20240320).
Kryteria włączenia obejmowały: (1) definitywną diagnozę osteosarcomy opartą na prezentacji klinicznej, obrazowaniu i badaniu patologicznym; (2) otrzymywanie HD-MTX jako monoterapii w cyklach; (3) brak ograniczeń płci i co najmniej jeden ukończony cykl chemioterapii; (4) monitorowanie stężenia metotreksatu we krwi podczas chemioterapii; (5) badania krwi przed i po chemioterapii, w tym pełna morfologia krwi i testy funkcji wątroby/nerek; (6) ogólnie dobry stan zdrowia, z normalnymi wskaźnikami funkcji wątroby i nerek. Kryteria wykluczenia obejmowały: (1) pacjentów, którzy nie ukończyli zaplanowanej chemioterapii HD-MTX; (2) pacjentów z wysiękiem opłucnowym lub otrzewnowym; (3) pacjentów ze słabym gojeniem ran pooperacyjnych; (4) pacjentów z niekompletnymi danymi dotyczącymi stężenia leku we krwi lub dokumentacji klinicznej. W oparciu o wytyczne kliniczne i wcześniejszą literaturę, badanie to definiowało opóźnioną eliminację metotreksatu jako C24h ≥ 10 μmol·L⁻¹, C48h ≥ 1 μmol·L⁻¹ i C72h ≥ 0,1 μmol·L⁻¹.
Przed chemioterapią pacjenci przechodzili nawadnianie i alkalizację (przyjmowanie płynów ≥ 3000 ml) na 24 godziny przed leczeniem. W dniu chemioterapii metotreksat był podawany na podstawie powierzchni ciała pacjenta (BSA) przy użyciu 5% roztworu glukozy do iniekcji i odpowiedniej dawki metotreksatu, infuzja trwała co najmniej 6 godzin. Monitorowanie EKG i pulsoksymetrii prowadzono przez 8 godzin, podczas których monitorowano stężenie metotreksatu we krwi, produkcję moczu i poziomy pH moczu, aby umożliwić wdrożenie terapii ratunkowej folinian wapnia (CF).
Średni wiek pacjentów wynosił 17,88 ± 7,03 lat (zakres: 7-47 lat), z czego 77,94% stanowili mężczyźni, a 51 pacjentów otrzymało chemioterapię przedoperacyjną. Objętość nawodnienia wahała się od 4072,50 do 4722,00 ml. Według dokumentacji diagnostycznej, 70,59% guzów było zlokalizowanych w kości udowej, co jest zgodne z rozkładem osteosarcomy w populacji chińskiej. Zebrano łącznie 82 zmienne, a rozkład danych nie był zgodny z rozkładem normalnym. Dwanaście zmiennych z ponad 50% brakujących danych zostało wykluczonych, a pozostałe braki uzupełniono medianą.
Czy augmentacja danych umożliwia precyzyjne modelowanie?
Ze względu na ograniczenia w częstości występowania i zbieraniu próbek, ilość dostępnych danych była stosunkowo mała. Aby rozwiązać ten problem, zastosowano algorytm k-najbliższych sąsiadów (k-NN) do augmentacji danych w celu ułatwienia modelowania predykcyjnego. Używając metody k-NN, ustawiono parametr ‘num_neighbors’ na 3, co oznacza wybór 3 najbliższych sąsiadów do interpolacji dla każdej próbki docelowej. Algorytm k-NN nie stawia założeń dotyczących rozkładu danych, co czyni go odpowiednim dla zbiorów danych o różnych formach dystrybucji. Algorytm działa poprzez pomiar odległości między różnymi wartościami cech i jest stosunkowo prosty koncepcyjnie. Dla konkretnych populacji k-NN może generować dane syntetyczne podobne do oryginalnych próbek, tym samym uzupełniając wielkość próby do celów modelowania.
Zbiór danych został podzielony na zbiory treningowe i testowe w proporcji 8:2. Normalność testowano za pomocą testu Shapiro-Wilka. Dla zmiennych, które były zgodne z rozkładem normalnym, zastosowano test t; dla zmiennych, które nie były zgodne z rozkładem normalnym, zastosowano test U Manna-Whitneya. Dla zmiennych kategorycznych użyto testu Chi-kwadrat (χ²) do oceny związków.
Brakujące dane były obsługiwane w zależności od zakresu ich braku. Zmienne z brakiem danych większym niż 50% zostały wykluczone, podczas gdy zmienne z brakiem danych mniejszym niż 50% zostały uzupełnione przy użyciu wartości mediany. Jest to zdeterminowane przez skośny rozkład danych. Zmienne kategoryczne były przetwarzane przy użyciu kodowania one-hot, aby rozwiązać problemy dyskretyzacji cech i rozszerzyć przestrzeń cech. Ostatecznie 68 zmiennych zostało zachowanych do dalszej analizy.
- Najczęstszy złośliwy nowotwór kości u dzieci i młodzieży (5% nowotworów dziecięcych)
- Szczyt zachorowań między 15-19 rokiem życia
- Standardowe leczenie oparte na wysokodawkowym metotreksacie (HD-MTX)
- Rokowanie:
– 70% przeżycia 5-letniego w chorobie zlokalizowanej
– Poniżej 30% przeżycia w przypadku przerzutów - Dawkowanie HD-MTX: 8-12 g/m² powierzchni ciała
Jak optymalizować predykcję stężeń metotreksatu przy użyciu ML?
Na podstawie przetworzonych danych medycznych pacjentów otrzymujących metotreksat, zastosowano algorytm losowego lasu (Random Forest) do identyfikacji kluczowych zmiennych spośród wielu czynników wpływających. Początkowo próbowano transformacji danych w celu optymalizacji struktury danych i poprawy wydajności treningu. Jednak po porównaniu stwierdzono, że transformacje takie jak transformacja logarytmiczna i transformacja Coxa negatywnie wpłynęły na zdolność modelu do oceny zmiennych. Dlatego po starannym rozważeniu, oryginalne dane zostały użyte do selekcji zmiennych.
Następnie wszystkie zmienne zostały włączone do modelu Random Forest w celu dopasowania, a zmienne zostały uszeregowane według ich ważności. Wydajność modelu oceniono za pomocą kilku metryk, w tym R², średniego błędu bezwzględnego (MAE) i pierwiastka średniego błędu kwadratowego (RMSE). Współczynnik determinacji (R²) jest miarą proporcji wariancji wyjaśnionej przez model, z wartościami od 0 do 1; im wyższa wartość, tym lepsze dopasowanie modelu. Średni błąd kwadratowy (MSE) reprezentuje średnią kwadratów różnic między przewidywanymi a rzeczywistymi wartościami, a pierwiastek kwadratowy MSE daje RMSE. RMSE jest wrażliwy na wartości odstające ze względu na podnoszenie błędów do kwadratu, co czyni go szczególnie przydatnym do oceny wydajności modelu, gdy zmienna docelowa nie jest zgodna z rozkładem normalnym. MAE mierzy średnią bezwzględnych różnic między przewidywanymi a rzeczywistymi wartościami.
Proces selekcji cech w modelu Random Forest wykazał, że włączenie cech znacznie poprawiło dopasowanie modelu i zmniejszyło błąd w początkowym etapie. Jednak wraz z dalszym zwiększaniem liczby cech, poprawa wydajności stawała się stopniowa i ostatecznie osiągnęła plateau, osiągając próg. Chociaż model osiągnął stosunkowo dokładne predykcje przy użyciu zaledwie siedmiu cech, konserwatywnie wybrano dziesięć cech do dalszej konstrukcji modelu, biorąc pod uwagę różne miary oceny, wcześniejszą literaturę i względy kliniczne.
Dziesięć cech wybranych przez model Random Forest obejmuje: wartość nawodnienia, współczynnik zmienności szerokości rozkładu czerwonych krwinek (RDW-CV), szerokość rozkładu płytek krwi (PDW), kreatynina (CREA), γ-glutamylotransferaza (GGT), wskaźnik dużych płytek krwi (PLCC), potas w surowicy (K), dehydrogenaza mleczanowa (LDH), masa ciała i prealbumina (PA).
Wykorzystując zmienne predykcyjne przefiltrowane przez Random Forest, skonstruowano i przeanalizowano siedem modeli regresji uczenia maszynowego. Przed konstrukcją modelu zastosowano metodę k-najbliższych sąsiadów (k-NN) do generowania próbek syntetycznych w celu rozwiązania problemu niewystarczającej wielkości próby. Algorytmy oceniane w badaniu obejmowały ekstremalny gradient boosting (XGBoost), Random Forest, regresję gradient boosting, light gradient boosting machine (LightGBM), regresję elastic net, regresję ridge oraz least absolute shrinkage and selection operator (Lasso).
Wybór modelu przeprowadzono przy użyciu 5-krotnej walidacji krzyżowej i metryk wydajności omówionych w sekcji Selekcja zmiennych. Walidacja krzyżowa została użyta do testowania odporności modeli, podczas gdy zdolność predykcyjna była oceniana przy użyciu metryk ewaluacyjnych. Idealny model predykcyjny powinien wykazywać wysokie R², wraz z niskimi MAE, MSE i RMSE.
- Wykorzystanie uczenia maszynowego (ML) do przewidywania stężeń leku we krwi
- Zidentyfikowano 10 kluczowych zmiennych wpływających na stężenie metotreksatu, w tym:
– Stan nawodnienia
– Parametry funkcji wątroby (GGT)
– Parametry funkcji nerek (kreatynina)
– Wskaźniki hematologiczne (RDW-CV, PDW) - Model LightGBM wykazał najlepszą skuteczność w przewidywaniu stężeń leku
- Potencjał personalizacji terapii i redukcji działań niepożądanych
Jak nowe metody zmieniają tradycyjne podejścia farmakokinetyczne?
Warto zauważyć, że chociaż model gradient boosting wypadł nieco gorzej w walidacji krzyżowej w porównaniu do LightGBM, nadal przewyższał inne modele zarówno w zestawach treningowych, jak i testowych. Wskazuje to, że podczas gdy model gradient boosting ma lepszą zdolność predykcyjną, jego wydajność generalizacji jest nieco słabsza. Przy większym zbiorze danych w przyszłości to ograniczenie może zostać rozwiązane. Dodatkowo, trzy algorytmy boosting (LightGBM, XGBoost, AdaBoost) wykazały podobną wydajność, podczas gdy rozszerzone modele regresji liniowej (Lasso, Ridge i ElasticNet) nie działały tak dobrze. “Nasze wyniki wskazują, że modele uczenia maszynowego oparte na algorytmach boosting przewyższają tradycyjne metody liniowe pod względem dokładności predykcyjnej przy pracy z nierównomiernie rozłożonymi i słabo zdefiniowanymi danymi medycznymi” – podkreślają badacze.
Funkcje wątroby i nerek odgrywają istotną rolę w metabolizmie leków. GGT jest powszechnie stosowany jako wskaźnik zdrowia wątroby, a jego ekspresja jest szczególnie aktywna w proliferacji i różnicowaniu szpiku kostnego oraz w progresji nowotworów hematologicznych. Funkcja nerek bezpośrednio wpływa na odkładanie się metotreksatu i jego metabolitów w kanalikach nerkowych, a poziomy CREA odzwierciedlają zdolność filtracji nerek.
Ponadto, zidentyfikowano, że LDH, RDW-CV, PLCC i P-LCR również wpływają na stężenia metotreksatu we krwi. LDH jest ściśle związany z zaburzeniami hematologicznymi i jest powiązany z proliferacją guza, inwazją i ciężkością, pomagając we wczesnej diagnozie i monitorowaniu skuteczności. Niektóre badania sugerowały LDH jako nowy biomarker. RDW-CV jest typowo używany do różnicowania typów anemii, ale może również służyć jako nowy wskaźnik predykcyjny dla chorób sercowo-naczyniowych i prognozy ogólnej populacji. PLCC i P-LCR są biomarkerami hematologicznymi używanymi do oceny stanu płytek krwi. Dla metotreksatu, leku, który może powodować znaczną supresję szpiku kostnego, wskaźniki te odzwierciedlają stan układu krwiotwórczego pacjenta.
Tradycyjne modele farmakokinetyczne opierają się na teorii przedsionkowo-komorowej lub farmakokinetyce fizjologicznej, aby opisać procesy metabolizmu leków poprzez parametry takie jak szybkość klirensu i objętość dystrybucji. Mechanizm jest jasny i może utrzymać stabilność w małych próbkach, umożliwiając bezpośrednie zrozumienie decyzji klinicznych. Jednak proces uzyskiwania i obliczania parametrów jest trudny do uchwycenia nieliniowych relacji między jednostkami, a dokładność symulowania złożonych interakcji leku z narządami jest ograniczona. Modele uczenia maszynowego bezpośrednio uczą się wzorca korelacji między stężeniem leku we krwi a czynnikami wpływającymi poprzez inżynierię cech, co ma przewagę w przewidywaniu heterogeniczności populacji i nieliniowych relacji. Jednak poleganie na wielkoskalowych oznakowanych danych i ekstrapolacja na nowe leki lub specjalne populacje stwarza ryzyko. Narzędzie wyjaśnialne SHAP może częściowo wyjaśnić wkład cech, ale atrybut “czarnej skrzynki” nadal ogranicza jego zastosowanie. Obie metody mają ograniczenia, ale próby ich integracji mogą kompensować ich odpowiednie niedoskonałości. Chociaż algorytm k-NN został użyty do amplifikacji próbek, wielkość próby tego badania jest nadal stosunkowo mała i brakuje kontroli. Model musi zostać zwalidowany i ulepszony. W przyszłości można rozważyć dalszą akumulację przypadków do eksperymentów z dostosowaniem dawki lub włączenie parametrów PK do modelowania uczenia maszynowego, aby zwiększyć interpretowalność modelu i kierować podejmowaniem decyzji klinicznych.
Jak nowe podejście wpływa na przyszłość terapii?
Zbieżność leczenia osteosarcomy, podawania wysokodawkowego metotreksatu i innowacyjnego zastosowania uczenia maszynowego oraz precyzyjnego dawkowania opartego na modelu do przewidywania stężeń leku we krwi podkreśla krytyczny obszar trwających badań. Poprzez dostosowanie dawki leku pacjenta na podstawie przewidywanego stężenia leku we krwi i istniejących zalecanych metod podawania przy użyciu naszego modelu badawczego, może być możliwe uniknięcie opóźnionej eliminacji leków i wystąpienia niepożądanych reakcji związanych z lekiem. Jednocześnie zapewniając nowy paradygmat predykcyjny odmienny od modeli farmakokinetycznych. Potencjał personalizacji terapii poprzez zaawansowane metody obliczeniowe ma znaczącą obietnicę poprawy wskaźników przeżycia i jakości życia u dotkniętych pacjentów. Ciągłe badania nad integracją ML i precyzyjnego dawkowania opartego na modelu (MIPD) w warunkach klinicznych, wraz z solidnymi badaniami farmakokinetycznymi, będą niezbędne do udoskonalenia protokołów leczenia i maksymalizacji skuteczności terapeutycznej.
Podsumowując, na podstawie rzeczywistych danych z 68 przypadków monitorowania terapii lekiem metotreksatem, badanie to wykorzystało augmentację danych i techniki uczenia maszynowego do identyfikacji i wyboru 10 kluczowych zmiennych, które znacząco wpływają na stężenia metotreksatu we krwi. Te zmienne obejmują stan nawodnienia, współczynnik zmienności szerokości rozkładu czerwonych krwinek, szerokość rozkładu płytek krwi, kreatynina, γ-glutamylotransferaza, wskaźnik dużych płytek krwi, potas w surowicy, dehydrogenaza mleczanowa, waga i prealbumina, wraz z ich ilościowymi relacjami. Model predykcyjny dla stężenia metotreksatu we krwi po chemioterapii wysokodawkowej u pacjentów z osteosarcomą został skonstruowany, z analizą SHAP użytą do interpretacji modelu. Po porównaniu z innymi modelami, algorytm LightGBM wykazał najlepszą wydajność predykcyjną.
Do tej pory badanie to jest pierwszym, które stosuje dane z rzeczywistego świata, augmentację danych i techniki uczenia maszynowego do przewidywania stężeń wysokodawkowego metotreksatu we krwi, oferując cenne spostrzeżenia i podejścia do modelowania do wykorzystania małych rozmiarów próbek w dziedzinie medycznej. “Nasze badanie stanowi pierwsze zastosowanie danych rzeczywistych, augmentacji danych i technik uczenia maszynowego do przewidywania stężeń wysokodawkowego metotreksatu we krwi” – piszą autorzy badania. Ponadto, metody uczenia maszynowego przełamały wąskie gardło tradycyjnego monitorowania, zapewniając możliwości zmniejszenia bólu związanego z pobieraniem krwi u pacjentów, poprawy bezpieczeństwa stosowania metotreksatu i promowania spersonalizowanego stosowania metotreksatu w szpitalach podstawowych. Dostarczają również pomysłów na rozwój farmakokinetyki i optymalizację dostosowania dawki.
Ograniczenie tego badania leży w jego jednożródłowej próbce, stosunkowo małym zbiorze danych i braku wieloośrodkowej zewnętrznej walidacji w celu potwierdzenia możliwości generalizacji modelu. W przyszłości, poprzez akumulację danych i zewnętrzne współprace, wiarygodność i stosowalność modelu zostaną dalej potwierdzone i zoptymalizowane.
Podsumowanie
Badanie koncentruje się na wykorzystaniu uczenia maszynowego w optymalizacji leczenia osteosarcomy wysokodawkowym metotreksatem. Analizując dane 68 pacjentów, naukowcy zidentyfikowali 10 kluczowych zmiennych wpływających na stężenie leku we krwi, w tym parametry funkcji wątroby, nerek oraz wskaźniki hematologiczne. Wykorzystując algorytm k-NN do augmentacji danych oraz różne modele uczenia maszynowego, wykazano, że LightGBM oferuje najlepszą wydajność predykcyjną. Model ten przewyższa tradycyjne metody farmakokinetyczne w przewidywaniu stężeń leku, umożliwiając bardziej spersonalizowane podejście do terapii. Jest to pierwsze badanie łączące dane rzeczywiste z technikami uczenia maszynowego w monitorowaniu terapii metotreksatem, otwierające nowe możliwości w optymalizacji leczenia i poprawie bezpieczeństwa pacjentów.