生物信息学方法大规模挑选肿瘤不同表达基因Word格式文档下载.docx
《生物信息学方法大规模挑选肿瘤不同表达基因Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《生物信息学方法大规模挑选肿瘤不同表达基因Word格式文档下载.docx(7页珍藏版)》请在冰点文库上搜索。
ABSTRACT:
ObjectiveToidentifypotentialcandidategenesrelatedtothecancerousphenotypebyanalyzingdatabasespubliclyavailable.MethodsUsingadataminingtoolcalledDigitalDifferentialDisplay(DDD)fromtheCancerGeneAnatomyProjectdatabase,ESTsfrom17differenttumortypeswereanalyzedfordifferentialexpression.ResultsWeobtained130upregulatedand159downregulatedgenes,mostofwhicharerelatedtocytoskeleton,ribosomalsubunit,substancemetabolism,cellcycle,signalconduction,transcriptionandtranslation.Thesegenesappearmostfrequentlyonchromosome12butrarelyonchromosome21andY.ConclusionInsilicoidentificationisahighthroughputscreeningstrategy.Ourstudymaylayafoundationforidentificationoffuturecanermarkersandprovideanewthoughtforscreeningstrategyofcancermarkers.
KEYWORDS:
insilico;
tumor;
digitaldifferentialdisplay;
EST
肿瘤一般是由基因组中某些基因的数量或结构发生改变而引发的。
对肿瘤组织中不同表达的基因进行转录子水平的大规模分析,有望挑选出在肿瘤发生发展中发挥重要作用的基因。
目前,已有多种大规模挑选的方式,如SAGE、微阵列、基因芯片等[1],可以对来源于不同组织类型和病理类型的标本的多个基因表达水平进行并行分析,已经取得普遍应用。
随着人类基因组测序的完成,基于生物信息学数据库的挑选方式也日趋取得科研工作者的应用[23]。
该方式可利用已有的数据信息,进行大规模高通量挑选,花费少、信息量大。
虽然目前已有很多研究者利用这种方式进行不同基因的挑选,可是对于全基因组和多组织的肿瘤相关基因的挑选研究却很少。
在本实验中,咱们采用CGAP网页中的数字化不同显示(digitaldifferentialdisplay)工具,挑选在17种肿瘤组织与其对应的正常组织中不同表达的基因。
对在≥2种肿瘤组织中,表达量大于对应正常组织10倍的基因(上调基因)和表达量不及对应正常组织1/10的基因(下调基因)进一步进行分析。
1材料与方式
数据库
利用基于EST信息的数据库进行肿瘤不同表达基因的挑选,共选取17种组织类型的肿瘤组织及其对应的正常组织的EST文库,包括骨、血液、脑、乳腺、结肠、眼、肾脏、肝脏、肺脏、淋巴结、肌肉、卵巢、胰腺、胎盘、前列腺、皮肤和睾丸。
所有EST文库均知足以下条件:
①组织来源与病理状态明确;
②非混合组织文库;
③非标准化且非消减文库。
数字化不同显示
利用CGAP网站中提供的cDNA数字化不同显示(DGED)工具挑选,进入其主页,参数设置均采用默许值,poolA为肿瘤组织,poolB为对应的正常组织,对17种组织类型别离进行挑选,所选择的文库构建方式均为非标准化非消减。
F值设置为2,P值设置为。
F值表示某一基因在某一肿瘤组织中相对其在对应正常组织中的表达量。
最终的输出结果为在某一肿瘤组织中表达量≥2倍或≤1/2对应正常组织中表达量的所有有统计学意义的基因。
F=肿瘤组织文库中代表某一基因的EST数量/肿瘤组织文库中所有EST数量对应正常组织文库中代表某一基因的EST数量/正常组织文库中所有EST数量
肿瘤相关候选基因的选择
在17种组织所有的输出结果中,选取在至少2种肿瘤组织中表达量与对应正常组织中表达量相差10倍以上的基因(F≥10或F≤1/10)作为肿瘤相关候选基因,分为上调基因和下调基因。
候选基因的分类及染色体定位
候选基因的分类及染色体定位来源于CGAP网站中genefinder工具中对查找基因的描述。
经实验验证的候选基因的电子表达谱分析
查阅挑选出的候选基因的相关文献,对于已经实验验证的上调和下调基因进行电子表达谱分析。
利用CGAP网站中的genefinder工具查找基因,查询结果中的MonochromaticSAGE/cDNAVirtualNorthern即为电子杂交结果。
2结果
肿瘤组织中的不同表达基因本实验利用生物信息学方式对多种肿瘤组织和相应正常组织进行大规模挑选,以期取得已知的或新的肿瘤不同表达基因。
结果见表1。
挑选出的基因包括已经被普遍研究的LDHB和FOS等。
在≥2种组织中同时上调的基因有130个,同时下调的基因有159个。
表1各类肿瘤组织中F≥10的基因数(略)
同一个基因在一种肿瘤组织中上调,而在其他肿瘤组织中可能下调,例如FDPS基因,EST电子杂交结果显示该基因在血液、脑、结肠、眼、肾脏、肝脏、肺、淋巴结、乳腺、肌肉、卵巢、胰腺、胎盘、前列腺、睾丸组织的肿瘤中表达上调,而在骨和皮肤组织的肿瘤中表达下调。
同一个基因在同一肿瘤中EST电子杂交和SAGE电子杂交结果也可能不同,例如FDPS基因,在肾脏肿瘤中,EST电子杂交结果显示该基因在肿瘤组织中表达上调,而SAGE电子杂交结果显示其表达下调。
候选基因的分类
挑选出的上调和下调基因中,均含有大量的编码细胞骨架蛋白、核糖体亚单位的基因和与物质代谢、细胞周期、信号传导、调节转录和翻译进程有密切关系的基因。
仅在上调基因中挑选出由缺氧诱导的因子、分子伴侣、与蛋白修饰相关的基因,而与凝血反映、血管生成和调节激素水平相关的基因仅在下调基因中被挑选出。
见表二、表3(功能未知的基因均未列出)。
表2在≥2种组织中F值≥10的上调基因(略)表3在≥2种组织中F值≤1/10的下调基因(略)
候选基因的染色体定位
对在≥2种组织中同时上调的130个基因和在≥2种组织中同时下调的159个基因进行染色体定位。
为避免可能出现的偏倚,计算某一染色体中上或(和)下调基因数与该染色体所含基因数的比值。
结果见表4。
可以看出,某些染色体相对“活跃”。
在21号和Y染色体上极少出现肿瘤相关基因,而在12号染色体中肿瘤相关基因出现的频率明显多于其他染色体。
表4候选基因的染色体定位(略)
在挑选出的130个上调基因中有23个已经实验验证在肿瘤中表达上调%),在159个下调基因中有16个经实验验证在肿瘤中表达下调%)。
这些基因的电子杂交结果见表5和表6。
表5经实验验证的在肿瘤组织中上调的基因电子杂交结果(略)表6经实验验证的在肿瘤组织中下调的基因电子杂交结果(略)
3讨论
随着生物技术和生物信息的飞速发展,基因芯片、微阵列和SAGE等技术已经被普遍应用于肿瘤相关基因的挑选。
这些方式可以并行处置多项信息,可是价钱昂贵,同时由于样本中RNA含量有限,可能会在不同的实验中产生误差。
而本实验以EST数据库中的信息为研究对象,数据量大,大体可以消除由于样本量小而产生的误差。
固然,基于EST数据库的肿瘤不同表达基因的生物信息学挑选也存在一些不足,例如文库测序数量较少、文库大小不一、文库组织来源不明确,和某些文库由多种组织混合构建[1315]。
基于这些不足,本实验对文库的选择也进行了限制,以保证结果更真实靠得住。
同时,由于该实验的基础是代表某一基因的EST拷贝数,因此所选文库必需为非消减非标准化的文库。
实验中比较了17种肿瘤组织与其对应的正常组织中基因的表达量,挑选出可能的肿瘤不同表达基因。
关于统计参数的选择,用不同分析参数进行分析,发现对比分析时参数不宜太严格,不然会挑选去掉很多有价值的基因。
分析时F值选择2,P值选,取得结果后再选取不同表达大于10倍的基因可以取得较理想的结果。
其中在≥2种组织中同时知足F值≥10(上调)的基因有130个,在≥2种组织中同时知足1/F值≥10(下调)的基因有159个。
这种生物信息学挑选方式可以短时间内挑选出大量不同表达基因,通过进一步的实验验证,这些基因可能会是用于肿瘤诊断医治的良好靶标。
130个上调基因中,含有23个编码核糖体亚单位组成部份的基因和大量与转录翻译进程相关的基因,这些基因产物对于调节肿瘤的蛋白质合成具有重要意义[16]。
肿瘤的一个重要特性就是无穷增殖,调控细胞周期的基因在肿瘤的发生发展中起了重要作用。
在挑选出的上调基因中,CDK4是在由G1期向S期进展中起重要作用的基因,该基因编码的蛋白与cdc28和cdc2高度相似,受D型细胞周期蛋白和CDK抑制因子p16调控,该基因编码产物对Rb基因产物的磷酸化起重要作用[1719]。
在挑选出的130个上调基因中,细胞角蛋白占5个,别离为KRT4、KRT14、KRT17、KRT1八、KRT19。
角蛋白的降解产物为可溶性片断,可在患者的血液中检测到,因此可作为肿瘤诊断的标志物[20]。
本实验除挑选出多个具有潜在诊断医治意义的不同表达基因外,还分析了这些基因在不同染色体上出现的概率,为此后的肿瘤发生发展的分子机制研究奠定了基础,也为肿瘤相关基因的挑选策略提供了新的思路。
总之,本实验结果表明,利用EST数据库对全基因组进行肿瘤不同表达基因的生物信息学挑选,是一种经济快速有效的挑选方式。
这些结果对此后肿瘤标志物的鉴定具有重要意义,为此后的挑选策略提供了新的思路。
【参考文献】
[1]GRAYJW,COLLINSC.Genomechangesandgeneexpressioninhumansolidtumors[J].Carcinogenesis,2000,21(3):
443452.
[2]RAJKOVICA,YANMSC,KLYSIKM,etal.Discoveryofgermcellspecifictranscriptsbyexpressedsequencetagdatabaseanalysis[J].FertilSteril,2001,76(3):
550554.
[3]WANGJ,LIANGP.DigiNorthern,digitalexpressionanalysisofquerygenesbasedonESTs[J].Bioinformatics,2003,19(5):
653654.
[4]STOCKC,BOZSAKYE,WATZINGERF,etal.GenesproximalanddistaltoMYCNarehighlyexpressedinhumanneuroblastomaasvisualizedbycomparativeexpressedsequencehybridization[J].AmJPathol,2008,172
(1):
203214.
[5]KOSACKAM,JANKOWSKAR.Theprognosticvalueofcytokeratin19expressioninnonsmallcelllungcancer[J].PneumonolAlergolPol,2007,75(4):
317323.
[6]DEBORTOLIM,CASTELLINORC,LUXY,etal.MedulloblastomaoutcomeisadverselyassociatedwithoverexpressionofEEF1D,RPL30,andRPS20onthelongarmofchromosome8[J].BMCCancer,2006,6:
223.
[7]HAUGU,ROTHENBACHERD,WENTEMN,etal.TumourM2PKasastoolmarkerforcolorectalcancer:
comparativeanalysisinalargesampleofunselectedolderadultsvscolorectalcancerpatients[J].BrJCancer,2007,96(9):
13291334.
[8]LINGJ,WIEDERKEHRU,CABINESSS,etal.Applicationofflowcytometryforbiomarkerbasedcervicalcancercellsdetection[J].DiagnCytopathol,2008,36
(2):
7684.
[9]IDEY,MIYOSHIE,NAKAGAWAT,etal.AberrantexpressionofNacetylglucosaminyltransferaseIVaandIVb(GnTIVaandb)inpancreaticcancer[J].BiochemBiophysResCommun,2006,341
(2):
478482.
[10]YANGZ,CHANGYJ,MIYAMOTOH,etal.TransgelinfunctionsasasuppressorviainhibitionofARA54enhancedandrogenreceptortransactivationandprostatecancercellgrowth[J].MolEndocrinol,2007,21
(2):
343358.
[11]KANEDAA,KAMINISHIM,SUGIMURAT,etal.DecreasedexpressionofthesevenARP2/3complexgenesinhumangastriccancers[J].CancerLett,2004,212
(2):
203210.
[12]BALDIA,DELUCAA,MORINIM,etal.TheHtrA1serineproteaseisdownregulatedduringhumanmelanomaprogressionandrepressesgrowthofmetastaticmelanomacells[J].Oncogene,2002,21(43):
66846688.
[13]SCHMITTAO,SPECHTT,BECKMANNG,etal.ExhaustiveminingofESTlibrariesforgenesdifferentiallyexpressedinnormalandtumourtissues[J].NucleicAcidsRes,1999,27(21):
42514260.
[14]IMYANITOVEN,TOGOAV,HANSONKP.Searchingforcancerassociatedgenepolymorphisms:
promisesandobstacles[J].CancerLett,2004,204
(1):
314.
[15]QIUP,WANGL,KOSTICHM,etal.GenomewideinsilicoSNPtumorassociationanalysis[J].BMCCancer,2004,4
(1):
4.
[16]BADERAG,VOGTPK.Anessentialroleforproteinsynthesisinoncogeniccellulartransformation[J].Oncogene,2004,23(18):
31453150.
[17]MEDEMARH,HERRERARE,LAMF,etal.Growthsuppressionbyp16ink4requiresfunctionalretinoblastomaprotein[J].ProcNatlAcadSci,1995,92(14):
62896293.
[18]LINDBERGD,HESSMANO,AKERSTROMG,etal.Cyclindependentkinase4(CDK4)expressioninpancreaticendocrinetumors[J].Neuroendocrinology,2007,86
(2):
112118.
[19]HALLM,BATESS,PETERSG.Evidencefordifferentmodesofactionofcyclindependentkinaseinhibitors:
p15andp16bindtokinases,p21andp27bindtocyclins[J].Oncogene,1995,11(8):
15811588.
[20]MOLLR.Cytokeratinsinthehistologicaldiagnosisofmalignanttumors[J].IntJBiolMakers,1994,9
(2):
6369.