Assemblaggio del trascrittoma e scoperta del gene della Cistanche Deserticola Fleshy Stem-Ⅱ
Sep 06, 2024
Classificazione funzionale di tutte le trascrizioni espresse basata sull'ontologia genetica e sui database KEGG
L'annotazione Gene Ontology (GO) è stata ottenuta dal file di associazione di identità e annotazioni UniProt. In totale, 20.907 trascrizioni, pari al 32,69% del totale delle sequenze espresse, sono state assegnate a 1.745 termini funzionali. Dei termini GO funzionali totali, le assegnazioni al processo biologico costituivano la maggioranza (1.116, 63,95%) seguite dalla componente cellulare (329, 18,85%) e dalla funzione molecolare (300, 17,20%). Le funzioni assegnate delle trascrizioni espresse coprivano un'ampia gamma di categorie GO e i primi 10 termini GO con le trascrizioni più annotate sono stati elencati nella Tabella 3. Forniamo la distribuzione di tutte le trascrizioni espresse in tre categorie di ontologia genetica (funzione molecolare, componente cellulare e processo biologico) nel file supplementare (S3 Dataset). I termini GO relativi alle funzioni di legame e all'attività della transferasi erano rappresentati prevalentemente nella categoria delle funzioni molecolari. Per quanto riguarda le funzioni di legame, il legame cationico (4.394 trascrizioni) ha rappresentato il più abbondante, seguito dal legame nucleotidico/nucleosidico (3.404 trascrizioni in media) e dal legame proteico (2.422 trascrizioni). Mentre nel gruppo con attività transferasi, la maggior parte sono quelli con gruppi contenenti fosforo trasferibili (2.256 trascrizioni, 65,77%). Nella categoria dei componenti cellulari, i trascritti erano più localizzati intracellulari (10.581 trascrizioni in media), mentre nella categoria dei processi biologici, i trascritti erano maggiormente coinvolti nel processo metabolico del biopolimero (6.683 trascrizioni in media), seguito dalla regolazione del processo cellulare (4.841 trascrizioni in media). ), espressione genica (4.678 trascrizioni) e trasporto (3.512 trascrizioni).

CISTANCHE TUBULOSA NATURALI PER LA PREVENZIONE DEL MORBO DI ALZHEIMER PHGS75% ECH 30% ACT 12%
Per estrarre i geni coinvolti nella biosintesi della lignina e del PhG, 21.358 sequenze proteiche potenziali non ridondanti sono state ricercate rispetto a sequenze genetiche di 13 organismi vegetali nel database KEGG e sono state assegnate a 275 percorsi KEGG con almeno 5 risultati. Le prime 10 vie con il maggior numero di sequenze allineate sono elencate nella Tabella 4. La maggior parte delle vie era coinvolta nei processi metabolici primari, come il metabolismo degli aminoacidi o delle proteine (ko01230, ko04141 e ko04120), il metabolismo dei carboidrati (ko01200 e ko00500) e il metabolismo dei nucleotidi o metabolismo dei nucleosidi (ko03018, ko00230 e ko00240). Inoltre, ci sono 27 percorsi correlati al metabolismo secondario (Fig. 2), come la biosintesi della spina dorsale dei terpenoidi, la biosintesi dei fenilpropanoidi, la biosintesi dei carotenoidi, la biosintesi degli alcaloidi isochinolinici e la biosintesi degli alcaloidi tropanico, piperidina e piridinico. Questi risultati forniscono un’ulteriore indicazione che nell’organismo erano in corso processi metabolici attiviC. deserticolatessuto dello stelo. Tutte le trascrizioni espresse associate ai percorsi KEGG sono state elencate nel file supplementare (set di dati S4). Sebbene esistano alcuni percorsi significativamente modificati tra C. deserticola e altre piante, come il riso (S5 Dataset), il nostro obiettivo principale in questo studio è rivelare l'intero profilo trascrittomico dello stelo di C. deserticola e descrivere i relativi percorsi di biosintesi di PhG. che potrebbe essere utile per orientare la coltivazione.

Geni candidati che codificano per enzimi coinvolti nella biosintesi della lignina
La lignina è il secondo polimero terrestre naturale più abbondante nel regno vegetale e costituisce fino a un terzo del materiale presente nelle pareti cellulari delle piante. Essendo un componente importante delle pareti cellulari, le lignine aiutano il trasporto dell'acqua, forniscono supporto meccanico e integrità strutturale e difendono da agenti patogeni ed erbivori. Questi ruoli della lignina sono molto preziosi nel supportare la crescita erettiva sotterranea di C. deserticola nel deserto. In questo studio, abbiamo presentato il quadro completo delle vie di biosintesi della lignina in C. deserticola (Fig. 3), in cui i monomeri di lignina vengono biosintetizzati dalla fenilalanina attraverso una serie di reazioni enzimatiche, tra cui idrossilazione, metilazione, riduzione e processo di polimerizzazione ossidativa. Sono stati rilevati enzimi correlati alla biosintesi della lignina per tre forme principalmente sintetizzate nel tessuto vascolare (p-idrossil-fenil (H), guaiacile (G) e siringil (S) lignina) e 5-idrossil-guaiacil lignina che è stata identificata solo in piante carenti di COMT (acido caffeico 3-O-metiltransferasi, EC 2.1.1.68) (come knock-down).

La fenilalanina ammoniaca-liasi (PAL, EC 4.3.1.24) è il primo enzima chiave nella via di biosintesi della lignina (Fig 3) che trasforma la fenilalanina in acido cinnamico mediante deaminazione non ossidativa. Sono state sequenziate un totale di 6.297 letture PAL e 7 trascrizioni PAL sono state assemblate in C. deserticola (Tabella 5). Confrontando le somiglianze di sequenze, abbiamo scoperto che 4 di esse (comp28550_c1_seq1/2/3/5) avevano più del 95% di somiglianza con la sequenza nota di mRNA di C. deserticola (gi| 289595227|gb|ADD12041.1|), mentre comp28550_c1_seq4 e comp25940_c0_seq1 avevano rispettivamente il 77% e l'82% di somiglianze. La previsione ORF ha rivelato che 5 trascrizioni avevano potenzialità di codificare proteine e trasportate con il dominio dell'amminoacido aromatico liasi (PF00221.14). Tra questi, solo il trascritto comp28550_c1_seq4 potrebbe codificare una sequenza proteica completa di 718 residui aminoacidici. È stato riportato che PAL è stato codificato da una piccola famiglia multigenica nella maggior parte delle specie vegetali, come 4 in Arabidopsis thaliana, 5 in Populus trichocarpa, 3 in Scutellaria baicalensis e 7 Cucumis sativus, ecc. La nostra analisi filogenetica ha suggerito che ce ne fossero 4 I geni che codificano per PAL in C.


deserticola e li abbiamo chiamati rispettivamente CdPAL1, CdPAL2, CdPAL3 e CdPAL4 (S2 Fig). 4-cumarato-CoA ligasi (4CL, EC 6.2.1.12) e trans-cinnamato 4-monoossigenasi (CYP73A, EC 1.14.13.11) sono due enzimi responsabili della trasformazione dell'acido cinnamico in dicumarolo-CoA in due processi inversi ordini. Sono anche nelle dorsali e i loro valori FPKM di espressione sono rispettivamente 39,57 e 51,93.

I quattro tipi di lignina venivano biosintetizzati mediante percorsi diversi controllati da tre enzimi chiave, cinnamoil-CoA reduttasi (CCR, EC 1.2.1.44), shikimato o-idrossicinnamoiltransferasi (HCT, EC 2.3.1.133) e ferulato{{1{ {56}}}}idrossilasi (F5H, EC 1.14.-.-). Il CCR è stato segnalato come un punto di controllo della via della lignina [50, 51] che catalizzava l'X-CoA (X che include dicumarolo, caffeoil, feruloil, 5-idrossil-feruloil e sinapoil) in Y-aldeide (Y che include p -cougar, caffeoyl, coniferyl, 5-idrossil-coniferyl e snap), mentre l'HCT ha catalizzato p-coumaroyl-CoA in p-coumaroyl shikimic acid/p-coumaroyl quinic acid. I due enzimi, proprio come un interruttore, regolavano la biosintesi delle lignine P-idrossi-fenil o degli altri tre tipi di lignine. F5H era un altro interruttore di ramo che regolava la siringil lignina e l'5-idrossil-guaiacil lignina. Altri enzimi importanti tra cui l'acido caffeico 3-O-metiltransferasi (COMT, EC 2.1.1.68), la caffeoil-CoA O-metiltransferasi (CCoAOMT, EC 2.1.1.104) e la cinnamil-alcol deidrogenasi (CAD, EC 1.1.1.195 ) sono stati rilevati espressi. Informazioni dettagliate sull'espressione sono elencate nella Tabella 6. Questi geni enzimatici identificati in questo studio forniranno una risorsa preziosa per studi genomici funzionali in questa importante pianta medicinale. 10 geni correlati al percorso di biosintesi della lignina nella Tabella 6 sono stati selezionati per la verifica RT-qPCR per confermare i nostri risultati RNAseq (Fig. 4) e le loro elevate correlazioni (coefficiente di correlazione di Pearson: 0,90343) hanno indicato un'elevata accuratezza e riproducibilità della nostra analisi del trascrittoma. Il set di dati S1 elenca le sequenze di primer utilizzate in questa analisi.

CISTANCHE TUBULOSA NATURALI PER MIGLIORARE LA FUNZIONE SESSUALE PHGS75% ECH 30% ACT 12%
Geni candidati che codificano per enzimi coinvolti nella biosintesi dei PhG
I glicosidi feniletanoidi (PhG) sono noti per essere i principali ingredienti attivi di C. deserticola con attività di miglioramento della potenza sessuale, eliminazione dei radicali liberi e anti-invecchiamento. Tre componenti chimici dei PhG sono acido organico, saccaride e aglicone feniletanolo (Fig. 3). Gli acidi organici tra cui acido caffeico, acido ferulico e acido cumalico sono prodotti della via di biosintesi dei fenilpropanoidi. I componenti del saccaride, inclusi glucosio e ramnosio, sono prodotti delle vie del metabolismo dei carboidrati, come il metabolismo dell'amido e del saccarosio, il metabolismo degli aminozuccheri e degli zuccheri nucleotidici, il metabolismo del fruttosio e del mannosio, ecc. Tuttavia, la via di biosintesi della parte feniletanolo non è ancora chiara. Qui, abbiamo proposto due possibili percorsi di biosintesi del feniletanolo basati sui nostri dati di sequenza. Una è la via dell'acido caffeico o dell'acido ferulico, nota anche come via dell'acido cinnamico, che è simile alla via principale della biosintesi della lignina. Un altro si basa sul percorso metabolico della fenilalanina (Fig. 3), in cui la fenilalanina in feniletanolo è stata ottenuta mediante un noto "percorso Enrlich" trovato per la prima volta nel lievito un secolo fa e convalidato nei fiori di petunia, nel pomodoro e nella rosa. Quattro geni enzimatici che codificano per aspartato/tirosina aminotransferasi, istidina-fosfato aminotransferasi e aminoossidasi primaria che sono responsabili della conversione della fenilalanina in feniletanolo sono stati rilevati espressi nello stelo di C. deserticola. Il prodotto del feniletanolo può essere ulteriormente ossidato dalla monoossigenasi o metilato dalla metiltransferasi nei suoi derivati (feniletanolo aglicone) che prendono parte alla biosintesi del PhG. In sintesi, sono state proposte due presunte vie di biosintesi dell'aglicone feniletanoloC. deserticolama necessitano ancora di ulteriori approfondimenti.
Discussioni
Negli ultimi anni, la genomica vegetale si è sviluppata rapidamente con l’applicazione della tecnologia di sequenziamento di nuova generazione, mentre poche ricerche si sono concentrate sulla genomica delle piante medicinali del deserto. È urgentemente necessario eseguire ricerche genomiche o trascrittomiche per comprendere il suo adattamento agli ambienti siccitosi e salini e il percorso di biosintesi dei principali componenti bioattivi. La scoperta de novo del trascrittoma di alcune piante medicinali,


come Panax ginseng, Ginkgo biloba e Glycyrrhiza uralensis sono stati sfruttati per la prima volta utilizzando la piattaforma Roche 454 per la sua lunga lunghezza di lettura. A causa dell'efficace capacità di assemblaggio con letture brevi, in particolare le letture accoppiate vantaggiose, il sequenziamento e l'assemblaggio del trascrittoma basati su Illumina sono stati ampiamente utilizzati anche per organismi modello e non modello. Nel presente studio, abbiamo generato circa 8G di letture accoppiate da 101 bp e prodotto sequenze unigene più lunghe con una lunghezza media di 725 bp. I dati sul trascrittoma specifico del gambo su larga scala potrebbero fornire dati di riferimento utili ed essere utilizzati per analizzare il metabolismo secondario dei componenti bioattivi di C. deserticola. L'81,62% delle letture grezze totali ha superato filtri di qualità rigorosi (incluso il taglio dell'adattatore e l'eliminazione delle letture di bassa qualità) prima dell'assemblaggio, suggerendo l'alta qualità dei nostri dati di sequenziamento, e l'82,08% delle letture di alta qualità sono state utili per l'assemblaggio. Altre letture che non sono state utilizzate per l'assemblaggio potrebbero derivare da errori di sequenziamento, parametri di assemblaggio e altro. Quelle letture di alta qualità inutilizzate sono rimaste utili per migliorare l'assemblaggio de novo combinato con letture più lunghe da un'altra piattaforma (come Roche 454) in futuro.

CISTANCHE TUBULOSA NATURALI PER MIGLIORARE LA FUNZIONE SESSUALE PHGS75% ECH 30% ACT 12%
Un gran numero di trascrizioni assemblate (30.098) hanno mostrato elevate somiglianze di sequenza con geni noti nei database pubblici, suggerendo che i nostri dati abbinati basati su Illumina coprivano una frazione sostanziale di trascrizioni di C. deserticola. Le trascrizioni senza riscontri BLAST possono essere dovute a regioni 3' o 5' non tradotte, RNA non codificante o nuove sequenze genetiche di C. deserticola. Le trascrizioni espresse sono state annotate in un'ampia gamma di categorie GO e percorsi KEGG (Tabelle 3 e 4), in cui molte trascrizioni sono state assegnate a percorsi secondari correlati al metabolismo. Come sappiamo, il fenilpropanoide può funzionare come un composto antimicrobico inducibile con grandi effetti salutari per uno stile di vita sotterraneo [1] e agire anche come molecola segnale nelle interazioni pianta-microbo oltre alla sua utilità medicinale [68, 69]. Il terpenoide viene utilizzato per la biosintesi di componenti bioattivi (come 6- deossicatalpol) [70]. Abbiamo scoperto che i geni coinvolti nella via di biosintesi della spina dorsale dei fenilpropanoidi e dei terpenoidi erano molto abbondanti in C. deserticola. Ancora più importante, la scoperta di percorsi ben rappresentati della biosintesi della lignina (Fig. 3) ha indicato il processo metabolico attivo della lignina nello stelo di C. deserticola. Tutti i geni enzimatici noti coinvolti nella biosintesi della lignina (Fig. 3) sono stati rilevati espressi e quattro enzimi chiave tra cui PAL, CCR, HCT e F5H avevano un'abbondanza di espressione inferiore (FPKM 26,47, 3,89, 3,4 e 3,83, rispettivamente) rispetto a altri geni enzimatici (Tabella 6). Merita di essere ulteriormente studiato se il cambiamento di espressione di questi tre geni possa influenzare o meno la produzione di lignina in C. deserticola. PAL è un enzima chiave nella biosintesi della lignina ed è anche coinvolto nella biosintesi di fenilpropanoide, resveratrolo, flavonoidi e cumarina [71–74]. Abbiamo rilevato quattro geni PAL distinti nel genoma di C. deserticola (Fig. S2), che coincideva con il fatto che PAL era codificato da una piccola famiglia multigenica [39, 43, 45–49] e abbiamo inoltre dimostrato che potrebbe svolgere un ruolo importante nel flusso metabolico del carbonio .
PhG è il principale ingrediente attivo di C. deserticola. I geni coinvolti nella biosintesi del feniletanolo sono importanti per la qualità di C. deserticola. Abbiamo dedotto due diversi percorsi di biosintesi del feniletanolo e 17 geni enzimatici coinvolti nella biosintesi PhG nello stelo di C. deserticola. Anche i possibili processi post-acido caffeico/ferulico (Fig. 3) sono stati dedotti per la prima volta sulla base di una formula strutturale di intermedi e proprietà catalitiche degli enzimi corrispondenti, in cui l'acido caffeico/ferulico verrebbe prima ossidato in derivato fenilpiruvato; poi, il gruppo carbossilico è stato privato dalle decarbossilasi; infine, il gruppo aldeidico è stato riconvertito in gruppo alcolico dalla deidrogenasi. Questa è la prima applicazione della tecnologia di sequenziamento accoppiato Illumina per studiare l'intero trascrittoma di C. deserticola e per assemblare letture RNA-seq senza un genoma di riferimento. Questo studio fornirà risorse e sequenze genetiche utili per la futura ricerca di genomica funzionale e proteomica su C. deserticola.
Conclusioni
In questo studio, abbiamo profilato il trascrittoma dello stelo di C. deserticola sulla base di dati di sequenziamento ad alto rendimento, identificato i geni coinvolti nelle vie di biosintesi della lignina e anche dedotto per la prima volta il potenziale percorso di biosintesi dei PhG, che sicuramente accelererà la comprensione degli ambigui processi fisiologici e del grande valore medicinale a livello molecolare. Fino ad ora, questo è il primo tentativo di assemblare de novo l'intero trascrittoma dello stelo di C. deserticola e di rilevare il percorso di biosintesi dei componenti medicinali utilizzando set di dati di sequenziamento basati su Illumina. Il nostro studio potrebbe promuovere lo sviluppo di medicine naturali e la selezione di cultivar con caratteristiche medicinali.

CISTANCHE TUBULOSA NATURALI PER MIGLIORARE LA FUNZIONE SESSUALE PHGS75% ECH 30% ACT 12%







