Rilevare la malattia renale cronica da campioni di sangue utilizzando le reti neurali

Mar 10, 2022

Per ulteriori informazioni:Ali.ma@wecistanche.com

Mohamed Ghassan Latheef*, Rajasvaran Logeswaran e Nurul Haniza Mohtar

Università di tecnologia e innovazione dell'Asia Pacifico, Bukit Jalil, 57000 Kuala Lumpur, Malesia

*E-mail dell'autore corrispondente:TP047492@mail.apu.edu.my,


Astratto.

Questo documento propone un approccio di rete neurale artificiale al rilevamento automaticoMalattia renale cronicaattraverso campioni di liquidi prelevati dai pazienti. Viene fornita la motivazione per lo sviluppo di un tale sistema, nonché i possibili vantaggi per i pazienti e l'industria medica. Sistemi simili proposti nell'industria e per la diagnosimalattia renale cronicaattraverso altri approcci come gli algoritmi di classificazione vengono esplorati. Viene raccolto un set di dati per addestrare la rete neurale e analizzate le caratteristiche, nonché la metodologia e gli strumenti da utilizzare nello sviluppo della rete neurale.

Termini dell'indice. ArtificialeReti neurali, Diagnosi medica, Analisi dei dati,Malattia renale cronica(CKD).

1. Introduzione

Si stima che circa 1 adulto su 10 soffra di qualche forma di danno renale, con milioni di persone che muoiono ogni anno con complicazioni legate aMalattia renale cronica(CKD) [1]. Lo studio Global Burden of Disease aveva l'insufficienza renale cronica al 27° posto nell'elenco delle cause di un numero totale di decessi nel mondo nel 1990, ma è salito al 18° nel 2010, un grado di movimento verso l'alto secondo solo a quello di HIV e AIDS. insufficienza renale cronica (Malattia renale cronica)è estremamente dannoso e incurabile, ma se preso in tempo il suo progresso può essere interrotto attraverso farmaci e una dieta adeguata.

Tuttavia, è difficile contrarre precocemente la malattia, a causa della mancanza di sintomi premonitori visibili esternamente nelle fasi iniziali. Pertanto, a meno che qualcuno non abbia altre condizioni che lo renderebbero più suscettibile al danno renale, se la persona è molto cauta e fa controlli regolari di tutto il corpo, o se ha fatto il test del sangue o delle urine per un altro motivo e casualmente ha anche riscontrato insufficienza renale cronica, normalmente insufficienza renale cronica(Malattia renale cronica) si trova solo nelle fasi intermedie e tardive.

insufficienza renale cronica(Malattia renale cronica) è determinato da quando per più di tre mesi si osserva che i reni non sono in grado di svolgere efficacemente le loro funzioni previste, come pulire il sangue dai rifiuti e dai prodotti in eccesso e aiutare a controllare la pressione sanguigna [2]. Ciò può portare a un accumulo di prodotti di scarto nel corpo del paziente, portando a gonfiore e gonfiore delle caviglie, insonnia, mancanza di respiro e debolezza. Quando si osservano anche questi sintomi, potrebbe essere già troppo tardi. L'insufficienza renale cronica precoce non mostra segni o sintomi esteriori, a volte anche fino al punto in cui la persona aveva già perso il 90% delle funzioni renali [3].

Gli attuali metodi di diagnosi di CKD(Malattia renale cronica) includere i risultati della misurazione della creatinina sierica nel sangue, i livelli di glucosio nel sangue per vedere se il paziente è diabetico (poiché i pazienti diabetici hanno una prevalenza molto alta di essere affetti da insufficienza renale cronica), nonché la misurazione dell'albumina o della presenza di proteine ​​​​nel urina, che verrebbe filtrata nei reni sani.

Tuttavia, questi generalmente richiedono tre mesi di monitoraggio dei livelli di creatinina, nonché altri criteri come ematuria, malformazioni congenite, ecc. Secondo l'Istituto nazionale per il diabete e le malattie digestive e renali (NIDDK) degli Stati Uniti, l'ultima ricerca suggerisce che una stadiazione /sistema di classificazione identifica il rischio di CKD dall'analisi dei dati del paziente con maggiore accuratezza nelle sue previsioni, richiede molteplici fattori e non semplicemente eGFR, livelli di creatinina o albumina, ma tutti e tre, età e stato del diabete [4]. Pertanto, questo progetto mira a utilizzare un insieme simile di dati del paziente con molteplici caratteristiche al fine di addestrare una rete neurale in grado di identificare modelli che indicano la presenza di CKD e fare una classificazione binaria. In tal modo, questo progetto mira a facilitare il processo di test per CKD(Malattia renale cronica) e ridurre i diversi mesi di attesa per determinare se il problema è cronico, semplicemente utilizzando i risultati di un esame del sangue e altre osservazioni e campioni fatti/prelevati, con maggiore fiducia sulla diagnosi basata su più fattori anziché su un singolo fattore, che avrebbe maggiori possibilità di essere un valore anomalo a causa di fattori esterni. Ciò è particolarmente importante poiché qualsiasi progressione dell'insufficienza renale cronica è irreversibile e quindi è nell'interesse dei pazienti che venga diagnosticata in modo rapido e accurato per iniziare il trattamento e adottare le misure appropriate per rallentare immediatamente il danno.

improve kidney function herb

Clicca per organicoCistanche per il trattamento della malattia renale cronica

2. Revisione della letteratura

2.1 Ricerca di dominio

La diagnosi medica e il processo decisionale sono un campo ad alto rischio ad alta priorità, dove fare diagnosi accurate è assolutamente fondamentale per la salute dei pazienti. ArtificialeReti neurali(ANN) e altre tecniche di apprendimento automatico vengono sempre più utilizzate per la diagnosi di malattie, con promettenti livelli di accuratezza.

Al-Shaya ha presentato due casi di ANN utilizzati per la diagnosi di (1) nefrite acuta, che si verifica quando i reni si infiammano improvvisamente e portano a insufficienza renale se non trattata, nonché (2) malattie cardiache [5]. È stata utilizzata la retropropagazione feed-forward, con il modello per la nefrite acuta che ha riportato un tasso di accuratezza nella diagnosi del 99% e delle malattie cardiache del 95%. Il modello per il primo aveva 6 input, 20 neuroni nascosti, 2 strati e utilizzava la backpropagation di Levenberg-Marquardt come algoritmo di addestramento, con addestramento basato sul miglioramento dell'errore quadratico medio (MSE). Quest'ultima rete utilizzava 2 strati, 22 input, 20 neuroni nascosti con altri fattori uguali al precedente.

Šter e Dobnikar hanno testato cinque diversi database medici (malattia coronarica, cancro al seno, epatite, diabete degli indiani Pima e malattie cardiache) con ANN e metodi discriminanti lineari più semplici [6]. La performance è stata relativamente la stessa, il che implica, hanno affermato, che i dati erano semplici con i valori che erano attributi indipendenti. In quanto tali, affermano che i sistemi di classificazione complessi o ANN non sono necessari nella diagnosi medica, poiché i risultati sono elevati anche per i metodi discriminanti lineari e Naïve Bayes. Tuttavia, va notato che hanno testato i metodi con configurazioni predefinite e nessuna messa a punto, e poiché essi stessi accettano che anche un guadagno di una piccola percentuale di imprecisioni nella diagnosi dei pazienti è vitale in quanto quantitativamente potrebbero arrivare fino a centinaia di migliaia di persone. Questo era uno studio precedente e le ANN sono cresciute in modo significativo da allora in poi, specialmente con il deep learning. Tuttavia, un problema persistente con le RNA è la mancanza di trasparenza: non è possibile vedere come l'ANN abbia preso la decisione che ha prodotto e su quali valori si basasse la decisione. Il paziente non sarebbe convinto se il medico non sapesse perché stanno somministrando al paziente il medicinale e il trattamento specifici semplicemente seguendo la prescrizione di una RNA. La mancanza di spiegazioni significa anche che i medici umani sono lasciati all'oscuro e non possono imparare dalle decisioni prese dall'ANN.

Liu et al. ha intrapreso il compito di testare l'accuratezza degli operatori sanitari rispetto alle tecniche di deep learning come l'ANN [7]. Per ottenere un set di dati il ​​più ampio possibile, hanno perlustrato articoli e analisi esistenti al fine di eseguire una meta-analisi, sugli studi dal 1 gennaio 2012 al 6 giugno 2019, per studi che confrontano le prestazioni diagnostiche per qualsiasi malattia dei modelli di apprendimento profondo rispetto agli operatori sanitari. Il confronto delle prestazioni per 14 di questi studi ha mostrato una sensibilità aggregata dell'87% e una specificità aggregata del 92,5% per i modelli di deep learning, con 86,4% e 90,5%, rispettivamente, per gli operatori sanitari. Sebbene i risultati siano simili, i modelli di deep learning nel complesso hanno funzionato meglio anche se marginalmente, e qualsiasi lieve aumento percentuale è ancora un riflesso di innumerevoli vite salvate o migliorate estrapolando tale cifra sul valore quantitativo di coloro che sono affetti da tali condizioni di salute.

2.2 Sistemi simili

Ci sono molti articoli che descrivono in dettaglio la diagnosi di CKD(Malattia renale cronica) utilizzando ANN o altri metodi, come l'utilizzo di Support Vector Machines (SVM) e Naïve Bayes.

Criplani et al. ha utilizzato Deep Neural Network per prevedere la CKD utilizzando 18 parametri nello strato di input, sebbene il numero di neuroni, strati e architettura di rete dello strato nascosto non fosse menzionato nell'articolo [8]. La Deep Neural Network ha avuto un tasso di vero positivo del 95,2 percento e un tasso di vero negativo del 100 percento, che è stato anche confrontato con altri metodi di classificazione, come Logistic, Random Forest, Adaboost, SVM e Naïve Bayes. Il documento affermava che la loro rete neurale profonda aveva la massima precisione tra tutti i metodi sopra evidenziati. Tuttavia, su un'ulteriore analisi dei risultati delle prestazioni forniti nel documento, sebbene lo stesso tasso di vero negativo sia stato ottenuto da tutti gli altri metodi di classificazione, Naïve Bayes e Random Forest, algoritmi relativamente più semplici, hanno eseguito così come l'ANN con il 95,2% di vero positivo precisione. Inoltre, sia Adaboost che SVM hanno raggiunto un tasso di accuratezza positivo reale del 96,2%, che è superiore a quello della rete neurale profonda. In un'altra tabella fornita, Naïve Bayes e Deep Neural Network sono stati mostrati con un'accuratezza del 97,7679%, mentre Adaboost e SVM avevano entrambi un'accuratezza del 98,2143% e Random Forest aveva un'accuratezza del 99,1071%. Pertanto, la loro conclusione che tra tutti i modelli confrontati, la rete neurale profonda fosse la migliore appare errata secondo le cifre fornite nel loro articolo, poiché non solo è più lenta e più alta nelle risorse computazionali consumate, Naïve Bayes, ha ottenuto risultati uguali, con Adaboost , SVM e Random Forest ottenendo una maggiore precisione.

Ahmad et al. ha utilizzato SVM per proporre uno strumento ausiliario di supporto alle decisioni per situazioni di emergenza, utilizzando 5 input: pressione sanguigna, creatinina sierica, volume cellulare concentrato, fattore di ipertensione e fattore di anemia [9]. L'SVM è stato codificato nel linguaggio di programmazione R, con una precisione del 98,34%. Hanno anche concluso nel loro articolo che l'importanza degli attributi era legata alla diminuzione media in Gini, o alla media della diminuzione totale della variabile nell'impurità del nodo, con un valore più alto maggiore è il ruolo dell'attributo. Usando questo, hanno scoperto che il volume delle cellule impaccate era l'attributo più importante nella diagnosi di CKD(Malattia renale cronica) dai dati. Poiché solo i livelli di creatinina sierica sono uno dei modi in cui viene diagnosticata l'insufficienza renale cronica ora, ciò crea qualche incertezza sul fatto che potrebbe essere più accurato fare affidamento invece sui valori del volume cellulare compresso.

Ravindra et al. utilizzato anche SVM per eseguire la classificazione e identificare la CKD(Malattia renale cronica) pazienti [10]. I valori di input sono stati distribuiti in quattro diversi casi in base alla stretta associazione tra loro, con:

Caso 1 -pressione sanguigna, peso specifico e creatinina sierica;

Caso 2 -albumina, zucchero, glicemia casuale ed emoglobina;

Caso 3 -volume di cellule piene, conta dei globuli bianchi e conta dei globuli rossi;

Caso 4 -albumina, zucchero, glicemia casuale, creatinina sierica, sodio, potassio ed emoglobina.

Ciascuno dei quattro casi è stato testato separatamente con il classificatore SVM senza gli altri fattori ed è stato riscontrato che il caso 2 aveva la massima precisione del 93,75 percento. Tuttavia, l'accuratezza è inferiore rispetto ad altri articoli in precedenza, che utilizzavano un numero maggiore di input. Pertanto, mentre l'albumina, lo zucchero, la glicemia casuale e l'emoglobina sembrano produrre buoni risultati da soli, altri input hanno dimostrato un aumento dell'accuratezza se inclusi insieme.

Salekin e Stankovic hanno utilizzato Random Forest e hanno ottenuto una precisione del 99,3 percento e un errore del quadrato medio di 0.1084 (RMSE) utilizzando 24 input [11]. Tuttavia, hanno quindi utilizzato una varietà di metodi come un metodo wrapper di apprendimento automatico e la regolarizzazione LASSO, per selezionare 5 funzionalità dalle 24 originali:

.peso specifico,.albumina,.diabete mellito,.ipertensione e.emoglobina.

Cistanche can improve kidney function

Cistanche può migliorare la funzione renale

Il documento ha evidenziato un metodo di rilevamento automatico conveniente, e quindi ridurre il numero di fattori necessari mantenendo l'accuratezza il più possibile al livello aumenterebbe l'efficacia in termini di costi a causa del minor numero di test necessari e del tempo impiegato per ottenere i risultati dei test. Stimano che con il tasso di inflazione di 2016 Stati Uniti e il prezzo dei test medici, non sarebbero necessari più di 45,05 USD per un test su un paziente. Con i 5 attributi, hanno raggiunto una precisione del 98% con 0,11 RMSE, una diminuzione di solo l'1,3% di precisione dopo aver scartato 19 delle 24 caratteristiche originali.

Vijayarani e Dhayanand hanno utilizzato MATLAB per confrontare le prestazioni di SVM e un ANN (feedforward con backpropagation) su un set di dati di pazienti con malattie renali [12]. L'ANN aveva una valutazione di accuratezza dell'87,70 per cento, con l'SVM che aveva un'accuratezza del 76,32 per cento. Tuttavia, SVM ha impiegato 3,22 secondi mentre l'ANN ha impiegato quasi il doppio di quel tempo a 7,26 secondi. La precisione era nettamente inferiore a quella dei sistemi citati in precedenza. Tuttavia, questo sistema aveva anche più della classificazione binaria di CKD(Malattia renale cronica) o Reni sani, invece, è stata classificata in 5 diversi casi: Normale, Sindrome nefritica acuta, CKD, Insufficienza renale acuta o Glomerulonefrite cronica, che hanno reso il compito più complesso.

2.3 Riepilogo revisione

L'articolo di Liu et al. mostra la fattibilità di ANN e altri sostituti dell'apprendimento automatico per sostituire l'occhio addestrato degli operatori sanitari, semplicemente essendo più accurati. Tuttavia, come sottolineano Šter e Dobnikar, c'è un problema con la trasparenza delle decisioni dell'ANN, poiché non c'è modo di identificare quale fattore abbia giocato in quella decisione e quanto pesantemente. I fattori possono essere identificati al di fuori dell'ANN attraverso vari metodi di data mining e analisi simili all'approccio di Salekin e Stankovic sull'CKD(Malattia renale cronica) caratteristiche per vedere quali giocano un ruolo più importante. Tuttavia, ci sono contraddizioni quando vengono utilizzati metodi diversi per identificare la priorità delle caratteristiche, come quell'insieme di 5 che condividono solo 1 caratteristica con il caso di massima precisione nei risultati di Ravindra et al., l'albumina. Inoltre, l'approccio Mean Decrease in Gini di Ahmad et al. ha rilevato che il volume delle cellule impaccate è il fattore più significativo, tuttavia, nessuno dei documenti precedenti aveva alcun significato attribuito a quel fattore nelle caratteristiche finali che hanno scelto per i loro sistemi.

Ci sono problemi con il modo in cui le ANN prendono le decisioni e, in un certo senso, quelle decisioni hanno qualche elemento di pregiudizio umano, poiché gli sviluppatori decidono quali input scartare come non necessari e quali mantenere. Salekin e Stankovic hanno comunque un buon punto; abbiamo i mezzi ed è giunto il momento di sviluppare una soluzione più accurata ed economica per identificare la malattia renale cronica(Malattia renale cronica) pazienti più velocemente, in modo tale che le persone evitino dolore, angoscia e morte indebiti.

3.0 Materiali e metodi

3.1 Programmazione della RNA

MATLAB è stato utilizzato per la prototipazione rapida in quanto consente la creazione nativa di ANN tramite il suo Deep Learning Toolbox senza alcuna codifica aggiuntiva. La figura 1 fornisce un'istantanea dello strumento di formazione ANN di Deep Learning Toolbox. Seguendo Kanban, tutte le attività del progetto vengono collocate su una lavagna virtuale, come Trello, con colonne diverse per le attività che sono già state completate (come la decisione sulla funzionalità del sistema, la raccolta dei dati, la pianificazione, la conclusione del rapporto preliminare, la compilazione modulo etico, ecc.), compiti in corso di completamento (rapporto investigativo finale) e compiti da completare in futuro (pulizia dei dati, formazione dell'IA con i dati, risultati dei documenti, ecc.). Il principio di base è mantenere un limite di lavoro in corso e attenersi ad esso, essere il più costante possibile senza superare il limite e svolgere troppi compiti contemporaneamente, e continuare fino al completamento del progetto.

3.2 Ottenere i dati di formazione e test

Per la formazione e il test del modello, sono state considerate due opzioni. Uno era contattare gli ospedali locali per informazioni anonime sui pazienti per uso puramente accademico e l'altro era trovare un set di dati disponibile per l'uso online. Online era la preferenza ed è stato trovato un set di dati con 400 cartelle cliniche, 250 CKD(Malattia renale cronica) pazienti e 150 pazienti non affetti da insufficienza renale cronica, raccolti dagli ospedali Apollo nel Tamilnadu, in India, nel corso di 2 mesi. C'erano 24 diverse caratteristiche, come mostrato nella Tabella 1. Tuttavia, i record erano incompleti, con dati mancanti o danneggiati in molti casi, come spesso accade. Se tutti i record con un valore vuoto fossero stati rimossi, i record utilizzabili sarebbero solo leggermente superiori a 200. Pertanto, è stato necessario esaminare metodi alternativi per pulire i dati e conservare i record incompleti, come sostituire i valori vuoti con la modalità, o il valore più comunemente visto nella caratteristica, ma con ulteriore considerazione per il valore più comune visto in altri record per quella caratteristica, tra i record che sono altrimenti più simili al record con la caratteristica mancante.

Cistanche for kidney disease

Cistanche per malattie renali

Figura 1. Strumento di formazione sulla rete neurale, una funzionalità del Deep Learning Toolbox

chronic kidney disease

Tabella 1. Elenco delle caratteristiche

kidney

kidney

10 dei valori erano anche testo che rappresentavano valori booleani, che dovevano anche essere ripuliti in 0 e 1 valori poiché solo i valori numerici sono accettati per addestrare l'ANN. Inoltre, è difficile per l'intelligenza artificiale (AI) senza un contesto linguistico fare l'associazione che "sì" è l'opposto di "no" invece di "1" e "0". A seconda dei risultati della pulizia dei dati e dei record conservati, è possibile che si debba fare affidamento su altre fonti di dati, come contattare gli ospedali per i dati anonimi dei pazienti.

4. Risultati e discussione

In media, l'età tipica di CKD(Malattia renale cronica) i pazienti sono risultati essere tra i 55 ei 75 anni, mentre l'età dei pazienti non affetti da insufficienza renale cronica era distribuita in modo più uniforme. Ciò dimostra che l'insufficienza renale cronica è più prevalente negli anziani, il che è ragionevole considerando la mancanza di problemi genetici, poiché per sviluppare l'insufficienza renale è necessario tempo e danni prolungati ai reni.

Il diabete mellito, comunemente noto anche come diabete, è un fattore di rischio che aumenta la possibilità di contrarre l'insufficienza renale cronica. Infatti, secondo l'American National Kidney Foundation [13], circa il 30 percento dei diabetici di tipo 1 e il 40 percento dei diabetici di tipo 2 si ammala di insufficienza renale cronica più avanti nella vita. Se i pazienti diabetici non regolano i loro livelli di glucosio nel sangue attraverso farmaci, iniezioni di insulina e dieta, i livelli elevati di glucosio ostruiscono i minuscoli capillari sanguigni nei reni, danneggiando i reni. Tutti i pazienti diabetici nel set di dati erano anche pazienti con insufficienza renale cronica, con più della metà delle insufficienza renale cronica(Malattia renale cronica) pazienti diabetici.

La conta dei globuli rossi in media nei pazienti con insufficienza renale cronica è inferiore a quella dei pazienti senza insufficienza renale cronica, variando da 2 a 6 milioni invece dei 4-7 milioni di globuli rossi sani per microlitro di sangue. Un basso numero di globuli rossi è indicativo di anemia. I reni producono un ormone chiamato eritropoietina (EPO), che induce il corpo a produrre cellule del sangue, una quantità sufficiente delle quali non viene prodotta quando la funzione renale diminuisce a causa del danno da CKD [14]. Di conseguenza, i livelli di EPO diminuiscono, causando a sua volta un calo del numero di globuli rossi, causando quindi anemia. Ciò porta a meno ossigeno trasportato in tutto il corpo, affaticamento generale, mancanza di respiro, estremità fredde (mani e piedi) e, nei casi peggiori, morte.

Sodio e Potassio sono sali minerali essenziali necessari per il corpo umano. Tuttavia, è possibile superare il limite giornaliero di assunzione, come per l'acqua. Normalmente, i reni eliminano i sali e i liquidi in eccesso, ma si verifica un problema quando non funzionano più come dovrebbero. Ciò porta a un accumulo di liquidi nei tessuti e nel flusso sanguigno, causando ipertensione, nausea, debolezza e ritmo cardiaco anormale [15]. Il potassio è compreso tra 3,3 e 5,25 per i pazienti non affetti da insufficienza renale cronica con un'elevata varianza e il sodio è compreso tra 135 e 151. Tuttavia, i valori di potassio di insufficienza renale cronica(Malattia renale cronica) i pazienti possono raggiungere un picco fino a 48,4, circa 10 volte superiore alla quantità normale, con un picco di sodio a 170,4.

Ci sono molti valori nei dati di input che hanno attributi collegati simili, come l'emoglobina, la conta dei globuli rossi e l'anemia. Naturalmente, un basso numero di globuli rossi e una bassa emoglobina sono correlati allo sviluppo dell'anemia. Allo stesso modo, esiste una correlazione tra i livelli di potassio e sodio con l'ipertensione, così come i livelli di glucosio nel sangue, lo zucchero e il diabete. Anche le cellule di pus e i grumi di cellule di pus, così come i valori dei batteri, sono correlati poiché la presenza di batteri causa il pus, che precede i grumi di cellule di pus. Questo può essere utilizzato per ridurre il numero di input o essere preso in considerazione durante la pulizia dei dati e l'aggiunta di valori incompleti. I pesi che l'ANN attribuisce a ogni singolo input avverrà attraverso l'addestramento e non sarà impostato manualmente, quindi è ancora da vedere se l'analisi corrisponde al processo decisionale della rete neurale.

5. conclusione

I dati analizzati dei pazienti mostrano uno schema chiaro attraverso l'analisi manuale dei dati anche all'occhio umano. Una RNA può essere in grado di vedere schemi molto più sottili nei dati numerici e può quindi presentare un alto livello di accuratezza in termini di diagnosi di CKD(Malattia renale cronica) nei pazienti attraverso l'osservazione dei valori delle caratteristiche presenti nei loro fluidi corporei. In effetti, la revisione di articoli su un argomento simile mostra che il numero di caratteristiche può essere ridotto e i test e i fluidi raccolti da un paziente possono essere ridotti. Pertanto, con una riduzione dei costi e degli sforzi, è possibile effettuare una diminuzione minima dell'accuratezza del risultato a causa della correlazione costantemente elevata mostrata tra alcuni valori.

Cistanche for kidney disease

Cistanche per malattie renali

Potrebbe piacerti anche