北京赛车软件|北京赛车网
歡迎光臨第一論文網,權威的論文發表,我們將竭誠為您服務!
您的位置: 第一論文網 -> 醫學綜述 -> 文章內容

ITS2二級結構系統發育信息在茄屬藥用植物DNA條形碼鑒定中的應用價值

作者:第一論文網 更新時間:2015年10月26日 21:11:14

  [摘要]ITS2是中藥鑒定的核心DNA條形碼之一,基于ITS2的中藥鑒定方法已被納入《中國藥典》,但分辨力不足仍是制約其推廣應用的主要因素,因此需要進一步挖掘其有助于中藥鑒定的遺傳信息。在細胞內,ITS2以二級結構形式發揮功能,這種結構所蘊含的豐富遺傳信息是核酸序列所無法體現的。該研究以茄屬Solanum 26個物種的40個樣本為研究對象來探究ITS2二級結構在茄屬藥用植物鑒定中的價值。作者利用PicXAA-R,MASTR和LocARNA軟件來比對二級結構,利用RNAstat軟件將二級結構信息轉為系統發育信息,最后利用最大簡約法進行建樹分析。研究結果表明將ITS2二級結構轉化為系統發育信息后信息位點增加了88.57%,物種關系樹上50%,75%,90%以上支持率的支系分別增加了19.05%,66.67%,66.67%,從而很好地解決了茄屬幾種藥用植物的鑒定問題。鑒于以上結果,作者建議將ITS2二級結構信息作為系統發育信息的有益補充加入到目前DNA條形碼分析中。 
  [關鍵詞]DNA條形碼; ITS2二級結構; 藥用植物; 茄屬 
  [Abstract]Internal transcript spacer 2 (ITS2) is one of the broadly used standard core barcodes and also the only nuclear barcode in identification of Chinese traditional medicine. Although the DNA barcode method based on ITS2 is popular and has been used in Chinese Pharmacopoeia, its low discriminatory efficiency is still a problem to its extensive application. Therefore, further study is still necessary to explore its phylogenetic information for medicinal plants identification. In cells, ITS2 activity is based on its secondary structure. The secondary structures are particularly useful in phylogenetic analysis because they include information not found in the primary sequence. In this study ITS2 secondary structure of 40 samples from 26 species were predicted and used to explore their utility in addressing the identification problems of Chinese traditional medicine in Solanum. The secondary structures were predicted and aligned, and their consensus models were generated using the three different software of LocARNA, MASTR and PicXAA-R. RNAstat software was used to transform the secondary structures into 28 symbol code data for maximum parsimony (MP) analysis. The results showed that the phylogenetic information increased 88.57% after ITS2 secondary structure information has been added, and then the support values above 50%, 75% and 90% in the tree increased 19.05%, 66.67% and 66.67%, respectively, indicating that the identification of Solanum medical plants has been well resolved. Thus, our analysis suggests that ITS2 secondary structure information should be incorporated into the current DNA barcoding analysis as a beneficial supplement of phylogenetic information. 
  [Key words]DNA barcode; ITS2 secondary structure; medical plants; Solanum
  DNA條形碼技術作為一種新興的分子鑒定技術,近年來受到廣泛的關注。該技術是利用一種短而標準的DNA片段對物種進行快速而準確鑒定的方法[1-2]。由于它不受物種的形態學特征及發育階段的限制,且準確性較高,在藥用植物鑒定中備受關注。ITS(internal transcribed spacer)具有進化速率快、易于擴增、通用性好和雙親遺傳等優點,已成為植物系統發育與進化研究中最重要的分子標記之一[3-5]。ITS2是ITS系統發育信息的主要來源,它在物種水平甚至種下水平都具有明顯的序列變異,具有更高的系統發育學價值,因此被建議作為種子植物、真菌物種鑒定的DNA條形碼[6-8]。在藥用植物鑒定中基于ITS2的藥用植物鑒定方法已被《中國藥典》收錄[9]。盡管ITS2作為DNA條形碼有諸多優點,然而它還不能像COI在動物中那樣成為物種鑒定的理想DNA條形碼,主要原因是分辨力依然較低[10]。提高分辨率的傳統做法是增加單一DNA片段的長度或片段組合數,然而這種方法費時費力,更重要的是隨著基因片段的增加,PCR成功率呈幾何倍數下降[11-12],不適用于像中藥材這樣DNA容易降解的材料。因此,如何在不增加片段長度的情況下提高DNA條形碼的分辨率是解決問題的關鍵。 以往的DNA條形碼研究大多基于ITS2一級結構(堿基替換信息),近年來有關ITS2二級結構的研究與應用逐漸被報道[13-17]。它是由RNA單鏈自身回折而形成的配對和未配對堿基交替而成的莖環結構,這為核糖體的剪切、正確組裝與成熟提供了必需信號[18]。這種生理結構的形態和進化特征是核酸序列所不能體現的,它們蘊含著潛在的系統發育信息[19-21]。早在20世紀80年代就有RNA二級結構在系統發育中的價值研究[22]。然而由于當時難以獲得和比對RNA二級結構并沒有引起足夠重視。隨著生物信息學的發展,關于RNA二級結構預測的算法大量涌現[23-26]。在二級結構的比對方面也有諸多的算法和軟件[27-29],特別是基于共有結構來比對長RNA的快速算法,如MRNA[30],MXSCARNA[31],R-Coffee[32]以及近年來出現的最大期望精確度算法(maximum expected accuracy,MEA)[33]大大提高了序列二級結構的準確性和運算速度。這些算法和運算軟件的發展為挖掘ITS2二級結構系統發育價值提供了技術保障。 
  茄屬Solanum L.植物廣泛分布于熱帶及溫帶地區,是藥用植物資源利用歷史較早且物種豐富的類群。該屬除了茄S. melongena L.、白英S. lyratum Thunb、龍葵S. nigrum L.被載入《中國藥典》之外,還有很多民間傳統中藥資源,如歐白英S. dulcamara L.、少花龍葵S. americanum Miller、澳洲茄S. laciniatum Aiton、珊瑚櫻S. pseudocapsicum L.等。茄的果實與葉片均含有葫蘆巴堿,有顯著的抗癌作用,茄根有散熱消腫,止血的功效,用于治療久痢便血、腳氣、凍瘡等[34];白英全草入藥,用于風熱外感,發熱咳嗽,濕熱黃疸等,外用于風濕痹痛等;龍葵全草有清熱解毒、利水消腫的功效,用于治療小便不利、瘡癰腫毒等[35]。這3種植物均為傳統中藥材,由于它們的應用歷史久遠、本草記載的植物來源不一、植物分布和藥材產地較廣、地方用藥習慣不同等原因,使得這些藥材與其替代品之間相互混用現象嚴重。這種混亂的現象嚴重影響了藥材的使用安全。然而由于正品和替代品之間形態特征非常相似,傳統的鑒定方法難以對它們進行快速而準確的鑒定。 
  本研究將ITS2二級結構的系統發育價值與DNA條形碼研究結合,并將其應用到茄屬常見中藥材的分子鑒定上,擬解決以下問題:①比較目前有關ITS2二級結構預測和比對的經典或最新方法,根據預測的準確性評估出最適用于DNA條形碼的方法;②比較ITS2核酸序列信息、ITS2二級結構信息以及ITS2核酸信息和二級結構信息聯合分析在茄屬藥用植物DNA鑒定中支持率和鑒定效率的差別,搞清楚ITS2二級結構是否能夠以及在多大程度提高物種鑒定效率。在此基礎之上為相關藥用植物的DNA條形碼鑒定提供方法參考。 
  1 材料 
  本研究選取了茄屬中部分具有藥用價值的物種,包括藥典收錄的白英、茄、龍葵及其近緣種,一些民間藥用植物,以及茄屬不同進化支系上的代表物種[36],共計26種,40樣本(表1)。 
  2 方法 
  2.1 ITS2序列的獲取及比對 
  從GenBank上下載相關物種的ITS序列,根據GenBank基因注釋信息或隱馬爾可夫模型(HMMs)[37]識別出ITS2的區域,去除在3′端和5′端的5.8S和26S rDNA序列,獲得完整的ITS2序列。利用Clustal X軟件對ITS2序列進行序列對比,比對結果使用Bioedit 7.0.5進行人工校正。 
  2.2 ITS2二級結構的預測、二級結構比對及比對方法評估 
  本研究分別選取了最新的RNA二級結構非漸進式的算法MASTR[38],最大期望精確度算法PicXAA[39],以及RNA二級結構比對中經典的LocARNA算法[40]。MASTR和PicXAA軟件具有二級結構生成和二級結構比對的雙重功能,將ITS2核酸序列矩陣的Fasta格式輸入后可直接產生各個序列二級結構的共有模型。本研究還使用了LocARNA二級結構比對功能,利用軟件Mfold[41]或網站ITS2 database二級結構預測在線服務器(http://its2-old.bioapps.biozentrum.uni-wuerzburg.de/cgi-bin/index.pl?custom)將核酸序列折疊成二級結構后,再將核酸序列和二級結構聯合矩陣輸入到LocARNA進行二級結構比對。 比較3種方法獲得的二級結構模型,篩選出最優模型。 
  2.3 二級結構信息編碼和系統發生分析 
  利用Subbotin等[42]提出的RNA二級結構28字符編碼法(圖1),即將螺旋中的4種堿基分為6種狀態(如AA,AC,AG,AU,A-,-A),同時將環上的4種堿基狀態作為額外特征一起考慮,一共得到28種堿基編碼,通過軟件RNAstat將ITS2二級結構轉化為結構信息矩陣。使用PAUP4.0b10中的最大簡約法(maximum parsimony,MP)對ITS2核酸信息、ITS2二級結構信息分別進行單獨和聯合系統發育分析。分析參數設置為啟發式搜索隨機重復1 000次,TBR分枝交換法獲取系統樹,選擇多重樹(multrees)選項。自舉分析1 000次重復以檢測分支的可靠性。利用PAUP4.0b10中的數據同質性檢驗(ILD test)模塊對核酸序列和其二級結構的系統發育信息的一致性進行評估。 3 結果 
  3.1 序列矩陣 
  3.1.1 3種二級結構比對軟件產生的結果比較 3種二級結構比對軟件產生了40條ITS2核酸序列的二級結構共有模型,都為莖環結構模型。其中LocARNA產生了典型的一環四臂結構,其中臂Ⅲ最長,臂Ⅱ最為保守,臂Ⅳ保守位點最少、變異最大。在堿基組成上LocARNA產生的二級結構也表現出了規律性:臂Ⅱ有一個嘧啶組成的鼓凸(bulge),臂Ⅲ有一段TGGT的共有序列(sequence motif),在臂Ⅰ和臂Ⅳ之間的大環富含嘌呤,這些特點都符合ITS2二級結構在植物中的共有特征[44]。除此之外,在茄屬還有一些特征性共有序列,如臂Ⅰ上的UCCG,GCC序列,臂Ⅱ上的CCGUG序列,臂Ⅲ上GUCGCGGC序列(圖2A)。MASTR和PicXAA產生的二級結構共有模型只顯示了結構,沒顯示核酸組成。PicXAA也產生了一環四臂的ITS2二級結構基本式樣,然而由于堿基配對過度嚴謹,大環上6~9,118~121位點處進行了互補配對打破了大環的整體結構(圖2B)。MASTR產生的二級結構共有模型為一環三臂類型(圖2C)。除此之外由于對每條序列插入/缺失處理不一樣,使得排列后矩陣的長度不一樣,LocARNA,MASTR,PicXAA排列后序列矩陣的長度分別為237,255,228 bp,與之對應的是各個臂上鼓凸的數量也有所不同。由于ITS2在植物中一環四臂的基本結構已被證實[45],因此LocARNA產生的運算結果較準確。 
  3.1.2 常規序列比對軟件與LocARNA序列比對軟件產生的結果比較 作者將常規序列比對軟件Clustal X對ITS2的序列比對結果(圖3A)與基于ITS2二級結構比對產生的矩陣(圖3B)進行了比較,發現兩者存在一些差別。首先兩矩陣的長度不一樣,Clustal X產生的矩陣長度為248 bp,ITS2二級結構比對產生的矩陣長度為237 bp。這是由于它們插入/缺失的位置不同,因此它們產生的信息位點也不一致(表2)。由于二級結構形式是ITS2在細胞內的存在形式,而常規軟件所假定的計算模型都是序列線型形式,因此基于ITS2二級結構比對的運算結果更能反應序列差異的真實狀態。 
  3.2 系統學分析 
  3.2.1 ITS2二級結構發育信息與核酸序列系統發育信息比較 ITS2二級結構由RNAstat編碼,共生成了169個堿基位點,包括111個變異位點和61個簡約位點。MP分析共產生106棵最短樹,每棵樹的步長均為265,CI為0.713 2,RI為0.836 6。作者將ITS2二級結構編碼信息構建的嚴格一致樹與核酸序列信息構建的嚴格一致樹進行了比較,發現兩者拓撲結構幾乎一致(圖4),ILD測試結果也表明,在序列數據與結構數據間沒有明顯的系統發育信息沖突(P=1.00),因此作者將這2組數據結合到一個數據集中,聯合矩陣中共406個位點,包括227個變異位點和132個簡約位點,與核酸常規序列比對算法(Clustal X)產生的矩陣相比信息位點增加了88.57%。聯合矩陣共計生成2棵步長為513的最短樹,其CI為0.690 1,RI為0.830 5(表2),這表明二級結構信息的加入在沒有顯著改變數據的異質性的情況下大大提高了信息位點的數量。 
  3.2.2 系統發育關系與物種鑒定結果 ITS2核酸序列與其二級結構編碼的信息聯合分析產生了一棵嚴格一致樹,該樹圖與常規使用的核酸信息相比解決了更多的種間關系。如在核酸信息構建的關系樹圖上龍葵、紅果龍葵S. villosum和少花龍葵3個近緣種之間的親緣關系沒有得到解決(圖5A),而加入ITS2二級結構系統發育信息后3個物種之間的關系得到了很好的解決(圖5B)。此外,ITS2核酸信息和二級結構信息聯合分析顯著提高了某些支系的支持率。如在核酸信息構建的樹圖上大于50%(低度及以上支持)、75%(中度及以上支持)和90%(高度支持)的支系分別為21,9,6個(圖5A),而在聯合二級結構信息構建的樹圖上相應的支系分別為25,15,10個。在該樹圖上傳統中藥龍葵與茄的不同個體自成單系,能夠與它們各自的近緣種區分出來。而白英與其近緣種歐白英、千年不爛心S. cathayanum相互嵌合在一起,并未區分開,研究結果提示需要在經典分類上對這3個種進行進一步的修訂(圖5B)。 
  4 討論 
  茄屬有1 400余種,是一個進化復雜、經典分類混亂的類群,前人曾嘗試對該類群進行DNA條形碼鑒定工作,但并未得到理想效果[46]。本研究將ITS2二級結構作為條形碼鑒定信息的有益補充應用到該類群部分藥用植物的鑒定上,研究結果表明這種信息可有效提高支系的支持率和物種的鑒定效率。中藥材經過加工、長時間儲存之后DNA容易降解,因此后續的DNA提取和PCR擴增十分困難。因此傳統上使用增加單一DNA片段的長度或片段組合數來提高物種分辨率的做法,并不適合中藥材。本研究將ITS2二級結構信息轉化成了系統發育信息,在沒有增加片段長度的情況下提高DNA條形碼的分辨率,這為藥用植物DNA條形碼鑒定率低的難題提供了解決思路。ITS/ITS2是植物系統發育研究使用最多的分子標記之一,也是中藥材分子鑒定的核心DNA條形碼,目前GenBank已有海量的ITS2數據,若有效利用ITS2二級結構信息可進一步促進分子系統學、DNA條形碼鑒定等相關學科的發展。 
  雖然二級結構的系統發育價值在20世紀80年代就被提出和研究,但是大規模利用該信息還需要澄清和解決一些難題。一個核心問題是如何比對和編碼二級結構,隨著生物信息學的發展,關于基因的二級結構比對的方法越來越多,出現了幾個不同的學派,例如德國的Wolf研究組、美國的Subbotin研究組和Coleman研究組,這些學派使用的分析方法均有不同。影響較大的Wolf研究組使用的4SALE比對方法是將ITS2核酸信息及其二級結構作為整體比對產生編碼信息[47],而本研究所使用的Subbotin的28字符編碼法可以將二級結構信息單獨編碼轉化成系統發育信息,并綜合比較了ITS2核酸序列信息、二級結構指導排列的核酸序列信息、ITS2二級結構信息以及ITS2核酸信息和二級結構信息聯合分析,可用于比較的系統發育信息更豐富,是一個很好的嘗試。此外,本研究所使用的MASTR,PicXAA,LocARNA這3種方法是目前最新的或最經典的二級結構比對方法,通過對比檢驗,本研究確定了最佳的LocARNA方法。這種方法不僅適用于ITS2序列,也適用于其他具有二級結構的系統發育分析分子標記,因此該方法可能比4SALE更有價值。另一個核心問題是數據的處理問題。在分子系統學中,目前廣泛使用的核酸信息是基于堿基的變異和排列,而對堿基變異的假設是獨立和隨機的[48]。二級結構的維持是通過堿基的相互作用,例如規范的配對AU,GC,不規范的配對GU,不穩固的AC,以及稀有的GA,AA[49-50]。在核酸發生變異時,一側堿基突變后,另一側與它互補的堿基也常常發生相應的替換(這可能與維持二級結構的穩定性有關),這種現象為堿基補償替換(compensatory base changes,CBCs)。如果一側堿基突變后,另一側與它互補的堿基沒有發生相應的替換,這種現象為半補償性替換(hemi-CBC)[51]。這種突變機制是目前的核酸所不具備的,而突變后堿基配對的方式也是核酸一級結構所無法體現的,因此二級結構信息包含著一級核酸序列所沒有的額外的系統發育信息[19,45],充分挖掘這種信息可以獲得更多的信息位點,從而解決更多物種的種間關系。然而,由于當前使用的JC69,K80,HKY85,GTR等分子進化模型不適用于ITS2二級結構的進化或堿基替代規律,因此依賴于進化模型的建樹方法如最大似然法(maximum likelihood,ML),貝葉斯方法(Bayesian,BI)或鄰接法(neighbour-joining,NJ)都不適合直接分析ITS2二級結構信息。鑒于上述原因,本研究利用了不依賴于分子進化模型的MP方法對ITS2二級結構系統發育分析做了很好的探索,然而后續研究需進一步探索ITS2二級結構的進化規律,以充分利用其分子變異信息。 基于ITS2序列信息構建的系統發育樹顯示白英、歐白英及千年不爛心并不能進行分子區分,而加上ITS2二級結構系統發育信息后也沒有解決三者之間的關系和分類地位。這3個物種不僅形態學特征極其相似而且化學成分和藥效也幾乎相同[52-53],古代本草、現代藥著乃至民間中藥,經常將它們共同作為中藥“蜀羊泉”、“白毛藤”或“苦茄”相互混用。如對“苦茄”的藥源植物,《中藥大辭典》認定為千年不爛心,而《中華本草》認定為歐白英。目前《Flora of China》將千年不爛心與白英合并為同一物種,而并未對歐白英進行分類處理。然而,曾經有研究認為白英是歐白英的一個變種[54]。歐白英與白英形態學特征極為相似,差別僅在莖與葉上被毛的長短,而且對于兩者的系統發生關系并沒有明確的分子證據[54]。本研究通過ITS2及其二級結構信息對歐白英與白英進行系統發生關系重建,首次為歐白英和白英間的系統發生關系提供了分子證據,支持將兩者進一步合并的分類處理,研究結果為該類群后續進一步的分類修訂提供了依據。 
  [參考文獻] 
  [1]Hebert P D N, Cywinska A, Ball S L, et al. Biological identifications through DNA barcodes[J].Proc Biol Sci, 2003, 270(1512): 313. 
  [2]Hebert P D N, Gregory T R. The promise of DNA barcoding for taxonomy[J]. Syst Biol, 2005, 54 (5): 852. 
  [3]Baldwin B G, Sanderson M J, Porter J M, et al. The ITS region of nuclear ribosomal DNA: a valuable source of evidence on angiosperm phylogeny[J]. Ann Mo Bot Gard, 1995, 82: 247. 
  [4]Alvarez I, Wendel J F. Ribosomal ITS sequences and plant phylogenetic inference[J]. Mol Phylogenet Evol, 2003, 29(3): 417. 
  [5]Besse P. Nuclear ribosomal RNA genes: ITS region[J]. Methods Mol Biol, 2014, 1115: 141. 
  [6]Chen S, Yao H, Han J, et al. Validation of the ITS2 region as a novel DNA barcode for identifying medicinal plant species[J]. PLoS ONE, 2010, 5(1): e8613. 
  [7]Li D Z, Gao L M, Li H T, et al. Comparative analysis of a large dataset indicates that internal transcribed spacer (ITS) should be incorporated into the core barcode for seed plants[J]. Proc Natl Acad Sci USA, 2011, 108 (49): 19641.
  [8]Schoch C L, Seifert K A, Huhndorf S, et al. Nuclear ribosomal internal transcribed spacer (ITS) region as a universal DNA barcode marker for fungi[J]. Proc Natl Acad Sci USA, 2012, 109 (16): 6241. 
  [9]陳士林, 姚輝, 韓建萍,等.中藥材 DNA 條形碼分子鑒定指導原則[J].中國中藥雜志, 2013, 38 (2): 141. 
  [10]Hollingsworth P M, Graham S W, Little D P. Choosing and using a plant DNA barcode [J]. PLoS ONE, 2011, 6(5): e19254. 
  [11]Staats M, Cuenca A, Richardson J E, et al. DNA damage in plant herbarium tissue[J]. PLoS ONE, 2011, 6(12): e28448. 
  [12]Srkinen T, Staats M, Richardson J E, et al. How to open the treasure chest? Optimising DNA extraction from herbarium specimens[J]. PLoS ONE, 2012, 7(8): e43808. [www. DyLW.net/zhidao/  第壹論文網 提供論文代寫和代寫論文服務]
  [13]高婷, 姚輝, 馬新業,等. 中國黃芪屬藥用植物DNA條形碼(ITS2)鑒定[J].世界科學技術——中醫藥現代化, 2010, 12(2): 222. 
  [14]Yao H, Song J, Liu C, et al. Use of ITS2 region as the universal DNA barcode for plants and animals[J].PLoS ONE, 2010, 5(10): e13102.

北京赛车软件