宫颈癌基因芯片数据的差异表达和聚类分析实验Word文档格式.docx
《宫颈癌基因芯片数据的差异表达和聚类分析实验Word文档格式.docx》由会员分享,可在线阅读,更多相关《宫颈癌基因芯片数据的差异表达和聚类分析实验Word文档格式.docx(20页珍藏版)》请在冰点文库上搜索。
.熟悉软件进行差异表达分析及聚类分析的操作方法及结果解释。
.熟悉网络搜索工具,浏览器及生物信息中心,掌握医学信息获取途径。
实验方法和流程:
一、选择研究基因
选定感兴趣的基因芯片数据:
宫颈癌是常见的恶性肿瘤之一,严重危害人群的健康。
研究显示宫颈癌的发生发展是一个由多基因参及,通过多途径作用,经过多阶段而逐渐演变的过程。
基因芯片作为一种高效、大规模获取生物信息的技术,能检测和分析肿瘤及正常组织的差异表达基因。
本研究利用公共基因芯片数据库中的芯片数据。
对宫颈癌基因芯片数据的差异表达和聚类分析。
↓
输入网址进入数据库
选择键入检索词
点击,进入数据库
点击
数据集编号
自上而下为标题、数据集描述、物种(人类)、平台号、索引出处、系列号、样本数量、数据类型、公布时间
几个缩写的涵义:
()——,描述实验平台的信息,对芯片平台而言,描述芯片类型及芯片上的探针(或)的数据,据此可以得知特定芯片包含多少个探针,每个探针对应着哪一个基因等信息;
()——,描述单个芯片试验的杂交数据,据此可以得知特定样本及芯片杂交之后测得的表达量或等位基因型等信息;
()——,包含一系列的,样本间存在相关性,据此可以得知多个相关样本的所有基因的表达量等信息;
()——,由职员根据编纂组合起来的条目,及类似,同样描述了多个相关样本的所有基因的表达量等信息。
点击右上角
可以看到研究采用的宫颈癌基因芯片数据集,包含个样本(),其中有例宫颈癌样本(实验组)和例正常样本(对照组)。
下载选择基因
二、软件操作
1、数据预处理,删除(可用打开)里面非数据部分信息
2、打开导入数据
基因芯片由荧光标记法分为单色标记及双色标记,前者大多用于寡核苷酸芯片实验,后者多用于芯片。
单色标记中,不同样品使用一种荧光染料及芯片杂交,双色标记将两个样品分别及不同荧光素(、)标记然后及同一芯片杂交。
探针对应的基因在测试样本中相对高表达,显示为红色,相对低表达相似为绿色,均不表达为黑色。
红绿颜色的相对强度则反映基因在两种样本中表达的数量之比。
3、数据过滤
因为所选基因芯片包含个基因,需要过滤掉一些生物信息量小的基因。
这里我们选择方差过滤
4、聚类分析
聚类结果图
样本名
存储和注释感兴趣的分类:
分为类
5、使用查找差异表达基因
显著基因个
差异表达基因结果图
红色为相对高表达(正相关),绿色为相对低表达(负相关),黑色为均不表达。
:
:
()