Sequenziamento dell'intero genoma per la diagnosi di disturbi neurologici da espansione ripetuta nel Regno Unito: uno studio retrospettivo sull'accuratezza diagnostica e uno studio prospettico di convalida clinica
Feb 19, 2022
Per maggiori informazioni:ali.ma@wecistanche.com
Riepilogo
Sfondo
I disturbi dell'espansione ripetuta colpiscono circa 1 individuo su 3000 e sono malattie clinicamente eterogenee causate dall'espansione di brevi ripetizioni del DNA in tandem. I test genetici sono spesso locus-specifici, con conseguente sottodiagnosi di persone che hanno presentazioni cliniche atipiche, specialmente nei pazienti pediatrici senza una precedente storia familiare positiva. Il sequenziamento dell'intero genoma è sempre più utilizzato come test di prima linea per altre malattie genetiche rare e abbiamo mirato a valutarne le prestazioni nella diagnosi di pazienti conneurologicodisturbi di espansione ripetuti.
Metodi
Abbiamo valutato retrospettivamente l'accuratezza diagnostica del sequenziamento dell'intero genoma per rilevare i loci di espansione ripetuti più comuni associatineurologicoesiti (AR, ATN1, ATXN1, ATXN2, ATXN3, ATXN7, C9orf72, CACNA1A, DMPK, FMR1, FXN, HTT e TBP) utilizzando campioni ottenuti all'interno del Servizio sanitario nazionale in Inghilterra da pazienti sospettati di avereneurologicodisturbi; I precedenti risultati dei test PCR sono stati utilizzati come standard di riferimento. L'accuratezza clinica del sequenziamento dell'intero genoma per rilevare le espansioni ripetute è stata esaminata prospetticamente in pazienti precedentemente testati geneticamente e non diagnosticati reclutati nel 2013-17 al 100 000 Progetto Genomes nel Regno Unito, sospettati di avere unneurologicodisturbo (forme familiari o ad esordio precoce di atassia, neuropatia, paraplegia spastica, demenza, malattia dei motoneuroni,parkinsonianomovimentodisturbi mentali, disabilità intellettiva o disturbi neuromuscolari). Se è stata effettuata una chiamata di espansione ripetuta utilizzando il sequenziamento dell'intero genoma, è stata utilizzata la PCR per confermare il risultato.
Risultati
L'accuratezza diagnostica del sequenziamento dell'intero genoma per rilevare le espansioni ripetute è stata valutata rispetto a 793 test PCR precedentemente eseguiti all'interno del SSN da 404 pazienti. Il sequenziamento dell'intero genoma ha classificato correttamente 215 su 221 alleli espansi e 1316 su 1321 alleli non espansi, mostrando una sensibilità del 97,3% (IC 95% 94,2–99,0) e una specificità del 99,6% (99,1–99 ·9) attraverso i 13 loci associati alla malattia rispetto ai risultati del test PCR. Nei campioni di 11 631 pazienti del 100 000 Genomes Project, il sequenziamento dell'intero genoma ha identificato 81 espansioni ripetute, che sono state anche testate mediante PCR: 68 sono state confermate come espansioni ripetute nell'intero intervallo patogeno, 11 non - espansioni o permutazioni intermedie patogene e due erano ripetizioni non espanse (tasso di false scoperte del 16%).
Interpretazione
Nel nostro studio, il sequenziamento dell'intero genoma per il rilevamento di espansioni ripetute ha mostrato un'elevata sensibilità e specificità e ha portato all'identificazione dineurologicoripetere i disturbi dell'espansione in pazienti non diagnosticati in precedenza. Questi risultati supportano l'implementazione del sequenziamento dell'intero genoma nei laboratori clinici per la diagnosi di pazienti che hanno aneurologicopresentazione coerente con un disturbo di espansione ripetuta.
Finanziamento
Medical Research Council, Department of Health and Social Care, National Health Service England, National Institute for Health Research e Illumina.
introduzione
Nonostante i recenti progressi nella nostra comprensione delle basi genetiche dei rarineurologicodisturbi, fino al 70% dei pazienti con tali disturbi rimane geneticamente non diagnosticato.1–3 In parte, ciò è dovuto alle sfide tecniche del test per varianti genetiche complesse e ripetitive, comprese le espansioni ripetute; si stima che tali espansioni colpiscano circa 1 persona su 3000 (appendice p 1) e siano la principale causa di oltre 40 disordini neurogenetici,4 tra cui la malattia di Huntington e la sindrome dell'X fragile. I disturbi dell'espansione ripetuta sono clinicamente e geneticamente eterogenei e l'espansione ripetuta può essere associata a varie malattie. Ad esempio, le espansioni in C9orf72 possono presentarsi come sclerosi laterale amiotrofica o demenza frontotemporale.5 Espansioni ripetute in diversi loci possono anche produrre caratteristiche fenotipiche simili, rendendole difficili da distinguere clinicamente: espansioni ripetute in almeno dieci geni di atassia spinocerebellare presenti frequentemente da adulti -l'atassia ad esordio,6 e quelli in C9orf72 e AR possono entrambi causare malattie dei motoneuroni.7,8

I disturbi dell'espansione ripetuta sono causati da un aumento del numero di brevi sequenze di DNA tandem ripetitive e le soglie di patogenicità per ciascun disturbo sono locus-specifiche. La dimensione dell'espansione varia da meno di 30 ripetizioni (ad esempio, in CACNA1A) a diverse migliaia di unità di ripetizione (ad esempio, in FMR1, DMPK, C9orf72 e FXN, che possono estendersi fino a 5 kb di dimensione). Le espansioni ripetute mostrano instabilità molecolare, che può portare a cambiamenti nella dimensione delle ripetizioni (generalmente aumentando in lunghezza) attraverso generazioni e tessuti.4 In queste condizioni, un aumento del numero di ripetizioni spesso porta a un esordio precoce e a una malattia più grave in successive generazioni.4 L'esordio pediatrico dei disturbi dell'espansione ripetuta può presentarsi come sindromi multisistemiche senza firme fenotipiche specifiche,9 ed è quindi più probabile che i bambini con questi disturbi siano sottodiagnosticati quando una storia familiare di disturbo dell'espansione ripetuta è assente rispetto a quando è presente.10– 12
La valutazione di laboratorio delle espansioni ripetute è in genere limitata alla valutazione molecolare mirata di un singolo locus guidata dalla sospetta diagnosi clinica utilizzando metodi basati sulla PCR o Southern blot,13 che possono essere costosi e richiedere molto tempo. Inoltre, a causa delle caratteristiche fenotipiche varie e sovrapposte di questi disturbi, i loci di espansione ripetuta associati alla malattia possono rimanere non testati.14
Il sequenziamento dell'intero genoma sta emergendo come strumento diagnostico di prima linea nei pazienti con malattie rare15 ma, fino a poco tempo fa, si pensava che avesse una capacità limitata di valutare loci contenenti espansioni ripetute.16 I progressi della bioinformatica, tuttavia, hanno reso possibile l'individuazione della malattia -causando espansioni ripetute dai dati di sequenziamento di prossima generazione.17-22 Qui, riportiamo sulla valutazione diagnostica di un approccio di sequenziamento dell'intero genoma per rilevare espansioni ripetute utilizzando dati PCR retrospettivi e la sua convalida clinica nei pazienti nel progetto 100000 Genomes che aveva un sospetto disturbo neurologico, non diagnosticato con precedenti test genetici.
Metodi
Progettazione dello studio e partecipanti
Questa valutazione del sequenziamento dell'intero genoma per il rilevamento di espansioni ripetute includeva valutazioni sia dell'accuratezza diagnostica che dell'accuratezza clinica. L'accuratezza diagnostica è stata valutata utilizzando i dati di pazienti che erano stati precedentemente testati mediante PCR per espansioni ripetute note per causare malattie neurologiche.4 I pazienti sono stati identificati da due fonti: il 100 000 Genomes Project e il Genomic Laboratory con sede presso gli ospedali universitari di Cambridge ( Cambridge, Regno Unito). Per entrambi i gruppi di pazienti, i test PCR sono stati eseguiti su campioni di pazienti dai laboratori del Servizio Sanitario Nazionale (SSN) nell'ambito della valutazione clinica di routine: per i campioni del Progetto 100000 Genomi, i test PCR sono stati eseguiti prima del reclutamento nel progetto da parte del Laboratorio di neurogenetica dell'University College London Hospital (Londra, Regno Unito); campioni con espansioni ripetute confermate dalla PCR sono stati ottenuti da pazienti testati dal laboratorio genomico con sede a Cambridge. I pazienti con risultati dei test PCR-positivi e PCR-negativi per disturbi di espansione ripetuti sono stati identificati per l'inclusione nel nostro studio attraverso sistemi di registrazione di laboratorio; tutti i pazienti avevano fornito il consenso informato scritto per l'uso del loro campione per l'assicurazione della qualità e per scopi di ricerca e formazione, come parte dell'ottimizzazione e della convalida del servizio clinico.

Il sequenziamento dell'intero genoma di ciascun campione è stato eseguito in uno dei due laboratori: Genomics England (Hinxton, Regno Unito) per i campioni 100000 Genomes Project (n=254) e Illumina Clinical Services Laboratory (ICSL; San Diego, CA, USA) per campioni ottenuti dal Genomic Laboratory con sede a Cambridge (n=150). Complessivamente, questo set di dati è stato utilizzato per la parte relativa all'accuratezza diagnostica dello studio e consisteva in dati PCR e di sequenziamento dell'intero genoma di 404 pazienti, che coprivano 13 loci che rappresentano i più comuni disturbi dell'espansione delle ripetizioni neurologiche: 11 loci associati ad atassia e disordini neurodegenerativi (HTT, AR, ATN1, ATXN1, ATXN2, ATXN3, ATXN7, CACNA1A, TBP, C9orf72 e FXN), un locus associato a disabilità intellettiva (FMR1) e un locus associato a distrofia miotonica (DMPK). Per ogni locus, i dati del test PCR erano disponibili per almeno un allele espanso (appendice p 24).
L'accuratezza clinica è stata valutata esaminando la concordanza delle espansioni ripetute, rilevate con il sequenziamento dell'intero genoma, con la diagnosi clinica sospetta dopo la conferma della PCR in pazienti con sospetti disturbi neurologici genetici (forme familiari o ad esordio precoce di atassia, neuropatia, paraplegia spastica, demenza , malattia del motoneurone,parkinsonianodisturbi del movimento, disabilità intellettiva o disturbi neuromuscolari) reclutati nel 100000 Genomes Project nel 2013-2017. Il 100000 Genomes Project è un programma del Regno Unito per valutare il valore del sequenziamento dell'intero genoma in pazienti con bisogni diagnostici non soddisfatti nelle malattie rare e nel cancro. A seguito dell'approvazione etica del progetto 100000 Genomes da parte del Comitato etico della ricerca Cambridge South dell'Inghilterra orientale (riferimento 14/EE/1112), inclusa l'analisi dei dati e la restituzione dei risultati diagnostici ai pazienti, questi pazienti sono stati reclutati da professionisti sanitari e ricercatori di 13 centri di medicina genomica in Inghilterra e sono stati arruolati nel progetto se loro o il loro tutore hanno fornito il consenso scritto affinché i loro campioni e dati fossero utilizzati nella ricerca, incluso questo studio. I probandi e, se possibile, altri membri della famiglia, sono stati arruolati in base a criteri di ammissibilità stabiliti per specifiche condizioni di malattia rara (appendice pp 5-11). I pazienti sono stati reclutati per il progetto 100000 genomi dopo test genetici standard di cura nel NHS, come indicato nei criteri di ammissibilità. I dati clinici standardizzati di base sono stati registrati utilizzando l'ontologia della fenotipizzazione umana (HPO)23 rispetto a modelli di dati specifici per la malattia.24 È stato anche raccolto lo stato della malattia dei membri della famiglia, rispetto all'indicazione clinica del probando per il test.
Per identificare espansioni causali ripetute in pazienti con malattia geneticamente non diagnosticata, abbiamo testato pazienti con sospetti disordini genetici coerenti con una malattia da espansione ripetuta. I pazienti sono stati selezionati sulla base della concordanza della loro malattia e dei termini HPO con disturbi associati all'espansione ripetuta. I dati di sequenziamento dell'intero genoma dei pazienti sono stati interrogati per cercare espansioni in particolari insiemi di ripetizioni utilizzando quattro diversi pannelli di espansione delle ripetizioni in base alle loro caratteristiche cliniche (appendice p 5). Le espansioni ripetute selezionate per l'inclusione in questi pannelli sono i più comuni loci di espansione ripetuta che causano malattie neurologiche. I pazienti con caratteristiche cliniche potenzialmente compatibili con più di un disturbo di espansione ripetuta sono stati testati su più pannelli. Se è stata effettuata una chiamata di espansione ripetuta utilizzando il sequenziamento dell'intero genoma, è stato eseguito il test di conferma mediante PCR.
Per ogni paziente con un'espansione ripetuta confermata, il medico locale è stato informato del potenziale risultato diagnostico ed è stato valutato il contributo dell'espansione ripetuta alle caratteristiche cliniche del paziente. Per le espansioni ripetute che spiegavano in tutto o in parte le caratteristiche cliniche del paziente, è stato emesso un rapporto diagnostico secondo le procedure standard locali.
Procedure
Per i campioni storici del NHS utilizzati nella parte relativa all'accuratezza diagnostica del nostro studio, le espansioni ripetute erano state precedentemente testate utilizzando l'amplificazione PCR e l'analisi dei frammenti. Il Southern blotting è stato eseguito per grandi espansioni C9orf72. Nella parte relativa all'accuratezza clinica del nostro studio, le espansioni ripetute rilevate dal sequenziamento dell'intero genoma nei pazienti del progetto Genomes 100 000 sono state testate mediante PCR in campioni conservati nei laboratori genetici del SSN. Ulteriori dettagli, comprese le sequenze dei primer, sono forniti in appendice (pp 2–3, 25–26).
Il DNA è stato preparato per il sequenziamento dell'intero genoma utilizzando la preparazione della libreria TruSeq DNA PCR-Free e il sequenziamento paired-end di 150 bp o 125 bp è stato eseguito su piattaforme HiSeq 2000 o HiSeq X presso l'impianto di genomi ad alto rendimento per Genomics England e presso l'ICSL . I genomi sono stati sequenziati a una profondità media di 35× (da 31× a 37×; appendice p 27). La genotipizzazione a ripetizione in tandem breve è stata eseguita utilizzando il pacchetto software ExpansionHunter versione 3.1.2.25,26 In breve, ExpansionHunter riallinea le letture di sequenziamento su un insieme predefinito di ripetizioni in tandem brevi per stimare la dimensione di entrambi gli alleli da un individuo (appendice p 3).

L'output di ExpansionHunter include una stima del numero di elementi ripetuti, delle dimensioni complessive e del limite di confidenza per ciascun locus valutato. Le linee guida dell'Association for Medical Pathology e del College of American Pathologists raccomandano l'ispezione visiva delle chiamate delle varianti durante la valutazione di routine delle varianti di sequenziamento ad alto rendimento.27
Tuttavia, varianti di brevi ripetizioni in tandem non possono essere adeguatamente visualizzate da strumenti di visualizzazione comuni come Integrative Genomics Viewer.28 Per esaminare i dati di sequenziamento dell'intero genoma alla base di ciascuna chiamata genotipica, è stato utilizzato uno strumento di visualizzazione del grafico, che consente la visualizzazione diretta degli aplotipi e del corrispondente accumulo di lettura dei genotipi ExpansionHunter (appendice pp 3, 15). L'ispezione visiva del grafico pileup è stata eseguita su tutte le brevi chiamate di ripetizione tandem di sequenziamento dell'intero genoma per confermare che la previsione ExpansionHunter per gli alleli era interamente contenuta in ciascuna lettura (cioè, la sequenza di ripetizione era più piccola della lunghezza di lettura del sequenziamento); confermare la presenza di un'espansione monoallelica o biallelica; per rilevare presunte chiamate false positive; e per rilevare alleli falsi negativi nelle espansioni bialleliche ripetute, come FXN (appendice pp 4, 16).
ExpansionHunter stima la dimensione della ripetizione dai dati di sequenziamento dell'intero genoma analizzando le letture di sequenziamento che contengono completamente o parzialmente una breve ripetizione in tandem. Se un allele di ripetizione tandem corto è più corto della lunghezza di lettura, ExpansionHunter prevede la dimensione esatta; se un allele di ripetizione tandem corto è più lungo della lunghezza di lettura, ExpansionHunter stima la dimensione della ripetizione all'interno di un CI, a seconda della composizione della sequenza del locus, della profondità del sequenziamento e della qualità del sequenziamento.
analisi statistica
Abbiamo classificato le ripetizioni come espanse dal sequenziamento dell'intero genoma se la dimensione prevista da ExpansionHunter era al di sopra del limite di premutazione o non espansa se la dimensione prevista era inferiore al limite (appendice p 28).
La sensibilità e gli IC per il rilevamento dell'espansione delle ripetizioni del sequenziamento dell'intero genoma sono stati calcolati come proporzione di alleli con ripetizioni espanse tra alleli precedentemente confermati dalla PCR con ripetizioni espanse. La specificità è stata stimata come la proporzione di alleli non espansi tra le ripetizioni non espanse precedentemente testate mediante PCR. Una descrizione completa delle formule statistiche è fornita in appendice (p 1).
Per confrontare le dimensioni delle ripetizioni mediante PCR con le stime delle dimensioni delle ripetizioni mediante il sequenziamento dell'intero genoma, gli alleli quantificati dalla PCR sono stati confrontati con le dimensioni delle ripetizioni previste da ExpansionHunter per alleli più brevi della lunghezza di lettura in tutti i 13 loci di ripetizione tandem brevi. La concordanza è stata calcolata dalla percentuale delle dimensioni delle ripetizioni previste da ExpansionHunter che erano in accordo con le dimensioni quantificate dalla PCR, tenendo conto dell'errore PCR di più o meno una ripetizione. L'analisi statistica è stata eseguita utilizzando il software statistico R versione 3.6.3.
Ruolo della fonte di finanziamento
Il design dello studio, l'iscrizione dei pazienti, la raccolta dei dati e il sequenziamento sono stati guidati da dipendenti di Genomics England e ricercatori accademici. I dipendenti di Illumina hanno eseguito il sequenziamento di 150 campioni di pazienti come componente pianificata dell'intero studio sull'accuratezza diagnostica del sequenziamento del genoma e hanno sviluppato ExpansionHunter. I dipendenti di Genomics England, ricercatori accademici e coautori RTH, ED e MAE hanno eseguito l'analisi e l'interpretazione delle espansioni ripetute nei pazienti reclutati per il 100 000 Progetto Genomes. Le fonti di finanziamento non hanno avuto alcun ruolo nell'interpretazione dei dati o nella stesura del rapporto.


Risultati
L'accuratezza diagnostica del sequenziamento dell'intero genoma per rilevare le espansioni ripetute è stata valutata rispetto a 793 test PCR precedentemente eseguiti all'interno del NHS da 404 pazienti (64 pazienti sono stati testati per più di una ripetizione; figura 1). Di questi test, 183 sono stati classificati come aventi una ripetizione espansa e 610 come non aventi un'espansione ripetuta mediante PCR, ottenendo un totale di 221 alleli individuali espansi e 1321 non espansi in 13 loci della malattia (appendice pp 24, 28). Il sequenziamento dell'intero genoma ha classificato correttamente 215 su 221 alleli espansi e 1316 su 1321 alleli non espansi rispetto ai risultati del test PCR (appendice pp 27, 29), mostrando una sensibilità iniziale del 97,3 percento (IC 95 percento 94,2-99 ·0) e specificità del 99,6 percento (99,1–99·9; tabella 1). Dopo la correzione visiva di tutte le chiamate in base alla qualità delle letture, la sensibilità è aumentata al 99,1 percento (96,8–99·9) e la specificità al 100 percento (99,7–100; figura 2A, tabella 1). La visualizzazione degli alleli espansi ha consentito il rilevamento di risultati falsi positivi e la riclassificazione di tutti gli alleli falsi negativi in FXN, di cui solo un allele è stato correttamente classificato come espanso in campioni con espansioni bialleliche (appendice pp 17, 18).

La lunghezza delle ripetizioni è stata quantificata mediante PCR in 509 test PCR interrogando 945 alleli in 13 loci di espansione delle ripetizioni. Le correlazioni tra ExpansionHunter e PCR per le dimensioni delle ripetizioni più brevi e più grandi della lunghezza di lettura del sequenziamento (cioè, 150 bp) sono mostrate nell'appendice (appendice p 19). È stata osservata un'elevata concordanza per ripetizioni più brevi della lunghezza di lettura, con una concordanza del 92,7 percento (836 su 902) tra PCR ed ExpansionHunter. È stata osservata variabilità del locus, con elevata concordanza tra ExpansionHunter e PCR per ATXN2, ATXN7, CACNA1A e HTT e bassa concordanza per DMPK o TBP (appendice p 30). Le lunghezze degli alleli maggiori della lunghezza di lettura sono state sottovalutate da ExpansionHunter, che ha influenzato l'accuratezza della chiamata in DMPK, FMR1 e FXN (figura 2B, appendice pp 19, 31).
Sebbene ExpansionHunter sia stato in grado di identificare correttamente grandi alleli espansi in FMR1, DMPK, C9orf72 e FXN (appendice p 29), le stime delle dimensioni previste tendevano ad essere inferiori a quelle ottenute dalla PCR poiché la dimensione delle ripetizioni aumentava all'interno dell'intervallo patogeno, il che ha influenzato il capacità di distinguere tra espansioni grandi e piccole in DMPK, C9orf72 e FXN, o tra espansioni complete e permutazioni in FMR1 (appendice p 31). Ad esempio, i loci con una lunghezza di ripetizione valutata mediante PCR maggiore di 200 ripetizioni in FMR1 e classificati come mutazione completa avevano una dimensione media di ripetizione stimata da ExpansionHunter di 92,6 (SD 17,8; appendice p 31).
Per testare la capacità del rilevamento dell'espansione ripetuta mediante il sequenziamento dell'intero genoma per risolvere la diagnosi di pazienti precedentemente testati e geneticamente non diagnosticati, abbiamo testato 11 631 pazienti con un sospetto disturbo neurologico genetico reclutati nel progetto 100000 Genomes (figura 1). I dati di sequenziamento dell'intero genoma sono stati valutati utilizzando quattro diversi pannelli di espansione ripetuti in base alle caratteristiche cliniche del paziente. Il numero di pazienti testati con ciascuno dei quattro pannelli è mostrato nella tabella 2.
Nel complesso, abbiamo rilevato e confermato visivamente espansioni ripetute in campioni di 105 pazienti (tabella 2, appendice pp 20, 33). Di questi, 81 campioni erano disponibili per il test di conferma mediante PCR e 68 avevano un'espansione ripetuta (0·6 percento di resa): 45 (1,2 percento) di 3692 nel pannello A, otto ({ {18}}·3 percento) di 2743 nel pannello B, cinque (0,6 percento) di 860 nel pannello C e dieci (0,1 percento) di 6731 nel pannello D. Tredici di 81 chiamate di espansione non sono stati confermati come espansioni ripetute patogene (tasso di false scoperte del 16%). Di questi, due erano alleli non espansi in ATXN1 e ATXN2, quattro erano chiamate di dimensioni intermedie FMR1 (appendice p 21) e sette erano permutazioni FMR1.
I dettagli clinici dei 68 pazienti con espansioni ripetute confermate dalla PCR, comprese le loro presentazioni cliniche, l'espansione ripetuta identificata e il contributo dell'espansione ripetuta alle caratteristiche cliniche del paziente sono forniti nella tabella 3; i termini HPO, la dimensione della ripetizione stimata da ExpansionHunter e se è stato emesso un rapporto diagnostico sono elencati nell'appendice (p 33).
Sono state osservate espansioni in pazienti che presentavano un'ampia varietà di presentazioni cliniche sovrapposte testate con il pannello A (tabella 3, appendice p 22), inclusa un'espansione ripetuta di ATXN2 in un paziente con malattia di Parkinson a esordio precoce responsivo alla levodopa e una storia di atassia cerebellare progressiva , ed espansioni AR in quattro pazienti con diagnosi clinica di malattia di Charcot-Marie-Tooth, di cui uno con neuropatia demielinizzante geneticamente confermata (cioè, malattia di Charcot-Marie-Tooth di tipo 1, paziente 42; appendice p 33). Un'ampia gamma di precedenti diagnosi cliniche è stata osservata in pazienti con espansioni ripetute patogene.
Ad esempio, in sette pazienti con sclerosi laterale amiotrofica o altre malattie dei motoneuroni, sono state identificate espansioni in AR (n=4) e C9orf72 (n=3). Nei pazienti con sospetta atassia ereditaria, abbiamo identificato espansioni in loci che non erano state valutate come parte del lavoro diagnostico di routine all'interno del SSN al momento del reclutamento, inclusi ATN1, ATXN2, ATXN3, ATXN7, CACNA1A, FXN, TBP e HTT ( tabella 3). Abbiamo anche rilevato espansioni ripetute in pazienti con caratteristiche cliniche coerenti con disturbi alternativi dell'espansione ripetuta, inclusa un'espansione C9orf72 nella malattia di Parkinson a esordio precoce e familiare (paziente 24, Tabella 3) ed espansioni ripetute nell'intervallo di penetranza ridotta in HTT (38 ripetizioni) in due sorelle con un disturbo del movimento, demenza, depressione e difficoltà di linguaggio (pazienti 44 e 45), sottolineando la sfida diagnostica presentata da questi disturbi dell'espansione ripetuta.
È stato riscontrato che otto bambini testati con il pannello B presentavano ampie espansioni ripetute CAG (figura 3), sette delle quali spiegavano completamente le caratteristiche cliniche del paziente. Sei pazienti non avevano una storia familiare informativa e non erano stati offerti test di espansione ripetuti come parte della loro valutazione clinica al momento del reclutamento (pazienti 48-53; tabella 3, appendice p 33). Due di questi bambini portavano grandi espansioni HTT (90–100 ripetizioni CAG). Da notare, un bambino aveva ereditato la ripetizione da un genitore sano senza una storia familiare di malattia di Huntington. I test familiari sono in corso, ma nella famiglia estesa è stato identificato un allele a penetranza ridotta, che indica che la ripetizione si è espansa di oltre 60 unità di ripetizione in una singola generazione (paziente 52). Al momento in cui scrivo, nessuno in famiglia ha mostrato segni di malattia di Huntington e sono in corso la consulenza genetica e i test per i genitori. Due bambini di età inferiore ai 5 anni portavano grandi espansioni ripetute in ATXN7 e presentavano una malattia multisistemica complessa. Per uno di questi bambini (paziente 50), il genitore ha mostrato problemi di andatura 2 anni dopo l'iscrizione al Progetto 100000 Genomi. Allo stesso modo, una ragazza di 10 anni con disabilità intellettiva è risultata avere una 99-espansione ripetuta in ATXN2, nonostante il fatto che entrambi i genitori fossero stati designati come inalterati, e una ragazza di 18 anni con demenza fosse affetta da { {19}}ripetere l'espansione in ATN1 (appendice p 33).

Sono state rilevate cinque espansioni nella DMPK (riquadro C), incluso in un bambino e una madre con una diagnosi clinica di distrofia muscolare, in due fratelli con sospetta miopatia distale e in un adolescente con miopatia congenita (pazienti 54-58). Espansioni FMR1 (riquadro D) sono state rilevate in nove ragazzi e una ragazza e una diagnosi di sindrome dell'X fragile ha spiegato in tutto o in parte le caratteristiche cliniche di presentazione (pazienti 59-68).
Discussione
La diagnosi dei disturbi dell'espansione ripetuta è difficile nell'assistenza sanitaria a causa di caratteristiche cliniche eterogenee e sovrapposte e di reperti clinici non specifici, che possono aumentare di gravità con l'età e in ogni generazione successiva. I disturbi dell'espansione ripetuta sono tra le cause più comuni di malattie neurologiche ereditarie.4 Tuttavia, i pazienti potrebbero essere sottodiagnosticati, o perché sono stati eseguiti test genetici insufficienti o perché le varianti genetiche causali devono ancora essere scoperte. Gli approcci ai test sono attualmente frammentati e i pazienti potrebbero sottoporre a test il locus di espansione ripetuto errato29 o ricevere un test molecolare per una diversa classe di varianti a causa della sovrapposizione delle caratteristiche cliniche con altri disturbi genetici neurologici.30


Il sequenziamento dell'intero genoma è stato utilizzato in molteplici contesti come test diagnostico di prima linea per malattie neurologiche rare, ma in precedenza si pensava che avesse una bassa capacità di rilevare espansioni ripetute.16 Sono stati sviluppati diversi strumenti per identificare espansioni ripetute dall'intero genoma sequenziamento nel contesto della ricerca,31 ma nessuno di questi approcci è stato applicato ai dati di sequenziamento dell'intero genoma raccolti da un gran numero di pazienti in un unico servizio sanitario. Presentiamo la prova che un algoritmo progettato per rilevare espansioni ripetute dal sequenziamento dell'intero genoma può valutare in modo affidabile le espansioni ripetute che causano malattie più comuni e risolvere casi precedentemente non diagnosticati geneticamente in un'ampia coorte di pazienti con disturbi neurologici. I nostri risultati indicano che il sequenziamento dell'intero genoma può distinguere tra alleli non espansi ed espansi con elevata sensibilità e specificità su 13 loci di espansione ripetuti (che possono essere ulteriormente migliorati mediante ispezione visiva), può calcolare con precisione la dimensione degli alleli più piccoli della lunghezza letta e potrebbe sottostimare le dimensioni di grandi espansioni in FMR1, DMPK, FXN e C9orf72.
Quando il rilevamento delle espansioni ripetute mediante sequenziamento dell'intero genoma è stato valutato rispetto a risultati positivi e negativi precedentemente ottenuti in laboratori di genomica diagnostica clinica utilizzando metodi gold-standard, abbiamo riscontrato una sensibilità minima del 97,3 percento e una specificità del 99,6 percento. Inoltre, abbiamo dimostrato che sia la specificità che la sensibilità possono essere migliorate curando manualmente il pileup di lettura, consentendo il rilevamento di risultati falsi positivi e la riclassificazione di alleli falsi negativi in campioni con espansioni bialleliche. Dei 6731 pazienti testati per FMR1 (pannello D), si prevedeva che 124 chiamate sarebbero state ampliate. Siamo stati in grado di escludere 97 attraverso l'ispezione visiva come probabili falsi positivi. Ciò indica che 1 test di sequenziamento dell'intero genoma su 54 avrebbe una chiamata FMR1 che dovrebbe essere ispezionata visivamente per scartare una potenziale chiamata falsa positiva. Sono in corso lavori per migliorare il metodo di genotipizzazione ExpansionHunter per ridurre il numero di chiamate false positive per FMR1.
We show that repeat sizing is accurate for repeats smaller than the sequencing read lengths, and therefore that most non-expanded and premutation CAG repeat expansion disorder alleles can be sized accurately. These results are consistent with other studies showing a strong correlation between whole genome sequencing and PCR quantification of repeat lengths smaller than the sequencing read length.19,25,26 Whole genome sequencing expansion detection is limited in its sizing of alleles considerably larger than the read length, such as in Fragile X syndrome. We note that all FMR1 repeats previously classified by PCR as fully expanded (ie, >200 repeats) were classified by whole genome sequencing as permutation (50–200 repeats) in this study. Repeat size estimation for repeats larger than the read length is particularly important for loci in which the length of the repeat correlates with the disease clinical features. This includes DMPK, for which small expansions (50–150 repeats) cause mild myotonic dystrophy type 1 and large expansions (>1000 ripetizioni) causano una malattia più grave e l'atassia spinocerebellare di tipo 36 (NOP56), per la quale espansioni superiori a 650 ripetizioni sono considerate patogene e le dimensioni delle ripetizioni di 15-650 sono considerate intermedie e varianti di significato incerto.
Sono stati identificati più di 40 loci di espansione ripetuti; molti di questi loci sono stati identificati solo di recente e sono ora associati a condizioni precedentemente inspiegabili, tra cui l'atassia cerebellare con neuropatia e sindrome dell'areflessia vestibolare (RFC1) 32 e l'epilessia mioclonica (SAMD12).33 I più comuni loci di espansione ripetuta che causavano malattie neurologiche erano selezionati per il nostro studio in base alla disponibilità di campioni di controllo positivi e negativi.
I risultati qui presentati suggeriscono che ExpansionHunter dovrebbe essere in grado di classificare accuratamente gli alleli non espansi ed espansi in qualsiasi locus di espansione ripetuta se gli alleli non espansi sono inferiori alla lunghezza di lettura (cioè, 150 bp). Sebbene la maggior parte dei loci di espansione ripetuti abbiano alleli inferiori a 150 bp quando non espansi, alcuni loci per i quali la dimensione dell'allele non espanso è vicina a 150 bp (ad es. NOTCH2NLC)34 potrebbero essere più difficili da genotipizzare utilizzando questo approccio. Per i loci in cui la ripetizione espansa è significativamente maggiore della lunghezza di lettura, il sequenziamento dell'intero genoma può rilevare espansioni patogene (ad esempio, NOP56,35 RFC120,32). Le tecnologie emergenti di sequenziamento a lettura lunga potrebbero offrire approcci complementari durante la genotipizzazione di grandi espansioni.36
La valutazione delle espansioni ripetute utilizzando il sequenziamento dell'intero genoma in 11 631 pazienti non diagnosticati reclutati per il progetto Genomes 100 000 ha prodotto 68 pazienti con risultati esplicativi. I pazienti sono stati reclutati per il 100 000 progetto Genomes dopo test genetici standard di cura; pertanto, la proporzione di espansioni ripetute identificata in questa coorte rappresenta un aumento della resa diagnostica rispetto al test NHS standard, che include test locus-specifici per disturbi dell'espansione ripetuta come FXN o DMPK. Da notare che alcune diagnosi non erano sospettate sulla base delle caratteristiche cliniche del paziente, inclusi sei pazienti pediatrici che non avevano una storia familiare nota di un disturbo dell'espansione ripetuta. Le dimensioni medie dell'espansione delle ripetizioni previste dal sequenziamento dell'intero genoma nei pazienti pediatrici descritti in questo studio sono sostanzialmente maggiori della media negli adulti, coerentemente con l'aspettativa che espansioni maggiori siano associate a un esordio precoce e più grave, anche nei bambini. Sono necessari ulteriori lavori, ma questa scoperta suggerisce che una valutazione della patogenicità dipendente dall'età e ripetuta dalle dimensioni potrebbe supportare una diagnosi pediatrica riducendo il potenziale rischio di identificare gli alleli di rischio dell'insorgenza nell'età adulta, portando a test predittivi non richiesti nei bambini.
I nostri risultati consentono la creazione di un flusso di lavoro diagnostico clinico per il sequenziamento dell'intero genoma (appendice p 23). Proponiamo che l'ispezione visiva venga eseguita per tutte le chiamate classificate come espanse per rilevare falsi positivi e per le espansioni bialleliche per le quali è stato rilevato un solo allele espanso (ad esempio, FXN). Si consiglia ai laboratori di utilizzare ExpansionHunter per valutare la presenza di un'espansione senza aderire alla stima delle dimensioni ed eseguire test PCR di conferma come componente standard del flusso di lavoro del test.

Le malattie ereditarie rare includono un'ampia gamma di caratteristiche cliniche, rendendo i test genomici locus-specific inefficienti, ardui e costosi. Presentiamo prove che il sequenziamento dell'intero genoma di grado clinico con il potenziale per diagnosticare una serie di malattie neurologiche rare che si presentano tipicamente con una singola base, indel o varianti del numero di copie potrebbe ora essere esteso a espansioni ripetute. Poiché il sequenziamento dell'intero genoma fornisce un unico test in grado di identificare le espansioni ripetute più comuni, oltre a consentire il test simultaneo di mutazioni puntiformi e varianti del numero di copie nei geni associati a queste condizioni, offre l'opportunità di identificare la maggior parte dei pazienti con questi disturbi eterogenei che non sono stati diagnosticati utilizzando test locus-specific. Nell'era delle terapie emergenti per questi disturbi, la diagnosi precoce potrebbe diventare cruciale.37 Questi risultati supportano l'implementazione del sequenziamento dell'intero genoma per il rilevamento di espansioni ripetute nei laboratori diagnostici clinici, un approccio che è già stato incluso nel NHS England National Genomic Test Directory,38 per lo studio di malattie neurologiche rare non diagnosticate.
Riferimenti
1 Ngo KJ, Rexach JE, Lee H, et al. Un tetto diagnostico per il sequenziamento dell'esoma nell'atassia cerebellare e nei disturbi neurologici correlati. Hum Mutat 2020; 41: 487–501.
2 Lynch DS, Koutsis G, Tucci A, et al. Paraplegia spastica ereditaria in Grecia: caratterizzazione di una popolazione precedentemente inesplorata mediante sequenziamento di nuova generazione. Eur J Hum Genet 2016; 24: 857–63.
3 Graziola F, Garone G, Stregapede F, et al. Rendimento diagnostico di un pannello genetico di sequenziamento mirato di nuova generazione per i disturbi del movimento a esordio pediatrico: uno studio di coorte di 3-anni. Genet anteriore 2019; 10: 1026.
4 Paulson H. Ripeti le malattie da espansione. Handb Clinic Neurol 2018; 147: 105–23.
5 Gossye H, Engelborghs S, Van Broeckhoven C, van der Zee J. C9orf72 demenza frontotemporale e/o sclerosi laterale amiotrofica. Seattle, WA: Università di Washington, 2015.
6 Klockgether T, Mariotti C, Paulson HL. Atassia spinocerebellare. Primer Nat Rev Dis 2019; 5:24.
7 Shakkottai VG, Fogel BL. Neurogenetica clinica: atassia spinocerebellare autosomica dominante. Neurol Clinic 2013; 31: 987–1007.
8 La Spada A. Atrofia muscolare spinale e bulbare. In: Adam MP, Ardinger HH, Pagon RA, et al, eds. GeneReviews. Seattle, WA: Università di Washington, 1999.
9 Gousse G, Natural H, Touraine R, et al. Forma letale di atassia spinocerebellare di tipo 7 con esordio precoce nell'infanzia. Arch Pediatr 2018; 25: 42–44.
10 Ansorge O, Giunti P, Michalik A, et al. Aggregazione e ubiquitinazione dell'atassina-7 in SCA7 infantile con 180 ripetizioni CAG. Ann Neurol 2004; 56: 448-52.
11 Ramocki MB, Chapieski L, McDonald RO, Fernandez F, Malphrus AD. Atassia spinocerebellare di tipo 2 che si presenta con regressione cognitiva nell'infanzia. J Child Neurol 2008; 23: 999–1001.
12 Mitchell N, LaTouche GA, Nelson B, Figueroa KP, Walker RH, Sobering AK. Atassia spinocerebellare a esordio nell'infanzia 3: distonia della lingua come manifestazione precoce. Tremore Altro Ipercinetico Mov 2019; pubblicato online il 13 settembre.
13 Uccello TD. Distrofia miotonica tipo 1. In: Adam MP, Ardinger HH, Pagon RA, et al, eds. GeneReviews. Seattle, WA: Università di Washington, 2019.
14 Aydin G, Dekomien G, Hoffman S, Gerding WM, Epplen JT, Arning L. La frequenza di SCA8, SCA10, SCA12, SCA36, FXTAS e C9orf72 ripetono le espansioni nei pazienti con SCA negativi per i sottotipi di SCA più comuni. BMC Neurol 2018; 18: 3.
15 Turro E, Astle WJ, Megy K, et al. Sequenziamento dell'intero genoma di pazienti con malattie rare in un sistema sanitario nazionale. Natura 2020; 583: 96–102.
16 Ashley EA. Verso la medicina di precisione. Nat Rev Genet 2016; 17: 507–22.
17 Liu HY, Zhou L, Zheng MY, et al. Utilità diagnostica e clinica del sequenziamento dell'intero genoma in una coorte di famiglie cinesi non diagnosticate con malattie rare. Rep. Sci 2019; 9: 19365.
18 Mousavi N, Shleizer-Burko S, Yanicky R, Gymrek M. Profilazione del panorama dell'intero genoma delle espansioni ripetute in tandem. Acidi nucleici Res 2019; 47: e90.
19 Tankard RM, Bennett MF, Degorski P, Delatycki MB, Lockhart PJ, Bahlo M. Rilevamento di espansioni di ripetizioni tandem in coorti sequenziate con dati di sequenziamento a lettura breve. Am J Hum Genet 2018; 103: 858–73.
20 Rafehi H, Szmulewicz DJ, Bennett MF, et al. Identificazione basata sulla bioinformatica di ripetizioni espanse: un'espansione del pentamero intronico non di riferimento in RFC1 causa CANVAS. Am J Hum Genet 2019; 105: 151–65.
21 Gross AM, Ajay SS, Rajan V, et al. Varianti del numero di copie nel sequenziamento del genoma clinico: distribuzione e interpretazione per malattie rare e non diagnosticate. Genet Med 2019; 21: 1121–30.
22 Trost B, Engchuan W, Nguyen CM, et al. Rilevamento a livello del genoma di ripetizioni di DNA in tandem che si espandono nell'autismo. Natura 2020; 586: 80–86.
23 Robinson PN, Kohler S, Bauer S, Seelow D, Horn D, Mundlos S. The Human Phenotype Ontology: uno strumento per annotare e analizzare la malattia ereditaria umana. Am J Hum Genet 2008; 83: 610–15.
24 Genomica Inghilterra. Modelli di dati clinici sulle condizioni di malattie rare. 2018. https://www.genomicsengland.co.uk/?wpdmdl=5500 (visitato il 4 agosto 2021).
25 Dolzhenko E, van Vugt JJFA, Shaw RJ, et al. Rilevamento di espansioni ripetute lunghe da dati di sequenza dell'intero genoma privi di PCR. Ris. genoma 2017; 27: 1895-903.
26 Dolzhenko E, Deshpande V, Schlesinger F, et al. ExpansionHunter: uno strumento basato su un grafico di sequenza per analizzare la variazione in brevi regioni ripetute in tandem. Bioinformatica 2019; 35: 4754–56.
27 Roy S, Coldren C, Karunamurthy A, et al. Standard e linee guida per la convalida delle pipeline bioinformatiche di sequenziamento di prossima generazione: una raccomandazione congiunta dell'Association for Molecular Pathology e del College of American Pathologists. J Mol Diagn 2018; 20: 4–27.
28 Robinson JT, Thorvaldsdottir H, Winckler W, et al. Visualizzatore di genomica integrativa. Nat Biotecnologie 2011; 29: 24–26.
29 Schneider SA, van de Warrenburg BPC, Hughes TD, et al. Omogeneità fenotipica della presentazione simile alla malattia di Huntington in una famiglia SCA17. Neurologia 2006; 67: 1701–03.
30 Schneider SA, Bird T. Malattia di Huntington, sosia della Malattia di Huntington e corea ereditaria benigna: cosa c'è di nuovo? Mov Disord Clin Pract 2016; 3: 342–54.
31 Bahlo M, Bennett MF, Degorski P, Tankard RM, Delatycki MB, Lockhart PJ. Recenti progressi nel rilevamento delle espansioni ripetute con il sequenziamento di prossima generazione a lettura breve. F1000Res 2018; 7: 736.
32 Cortese A, Simone R, Sullivan R, et al. L'espansione biallelica di una ripetizione intronica in RFC1 è una causa comune di atassia a esordio tardivo. Nat Genet 2019; 51: 649–58.
33 Ishiura H, Doi K, Mitsui J, et al. Espansioni di ripetizioni TTTCA e TTTTA introniche nell'epilessia mioclonica familiare adulta benigna. Nat Genet 2018; 50: 581–90.
34 Ishiura H, Shibata S, Yoshimura J, et al. Espansioni ripetute CGG non codificanti nella malattia da inclusione intranucleare neuronale, nella miopatia oculofaringodistale e in una malattia sovrapposta. Nat Genet 2019; 51: 1222–32.
35 Rafehi H, Szmulewicz DJ, Pope K, et al. Diagnosi rapida di atassia spinocerebellare 36 in una famiglia di tre generazioni utilizzando dati di sequenziamento dell'intero genoma a lettura breve. Mov Disordine 2020; 35: 1675–79.
36 Mantere T, Kersten S, Hoischen A. Sequenziamento a lettura lunga emergente nella genetica medica. Genet anteriore 2019; 10: 426.
37 Ellerby LM. Disturbi dell'espansione ripetuta: meccanismi e terapie. Neuroterapie 2019; 16: 924–27.
38 Sistema sanitario nazionale. Directory nazionale dei test genomici: criteri di test per malattie rare ed ereditarie. ottobre 2021.






