博士学位论文答辩评阅意见书.docx
《博士学位论文答辩评阅意见书.docx》由会员分享,可在线阅读,更多相关《博士学位论文答辩评阅意见书.docx(11页珍藏版)》请在冰点文库上搜索。
博士学位论文答辩评阅意见书
博士学位论文答辩评阅意见书
论文题目:
变量选择和变换的新方法研究
博士生:
唐凯临
学号:
0410104002
院(系、所):
化学系
专业:
无机化学
指导教师:
李通化教授
年月日
教授:
鉴于您在本学科的造诣和学术声望,特聘请您对我校化学系
无机化学专业博士生唐凯临的学位论文进行评阅。
现呈上该生论文,请您在百忙中抽时间给予审阅〔请重点审阅论文的创新性、学术性〕。
并将评阅意见于年月日前邮寄或送达博士生所在
学院收
地址:
上海市四平路1239号邮政编码:
200092
谢谢您的支持!
同济大学研究生院
〔学院代章〕
申请人
唐凯临
专业
无机化学入学年月2004.3
论文题目
变量选择和变换的新方法研究
申请人对学位论文的自评
序号
主要创新点
〔每点不超过100字〕
1
对于多变量少样本的超大规模数据先将其利用函数映射至特征空间,经转换之后的变量以样本之间的关系代替了原先的变量之间的关系。
这样许多在原样本空间用线性方法难以解决的问题,在特征空间中可以轻而易举地完成。
2
将质谱数据分为假设干区间,计算每个区间的多阶统计量,以这些反映了波形特点的多阶统计量作为新的变量进行分类计算。
不仅大大减少了变量还使用了数据的局部信息,分类效果也得到进一步提高。
3
提出了一种将连续变量转换成离散变量从而寻找特异模式的方法。
首先将连续变化的谱转为离散变量。
然后经过模式生成,模式比较,模式精化,找到肿瘤和正常两类各自特有的模式,得到有意义的生物标记物。
申请人对学位论文的自评
不足之处〔含原因及改进方法〕
1、核函数在本文的分类和回归问题中起着非常重要的作用。
不同的核函数往往对拟合结果有很大影啊。
对于核函数类型,本文中还是凭经验选择,目前还没有系统的理论指导方法,这一方面需要进一步的理论研究。
2、模式变量选择中对于区间的划分、多种模式选择的方法还需要进一步的研究。
对于多种蛋白的共同作用,biomarker确实定还需要生物化学实验确实认。
3、分子对接结果用于QSAR研究还需要进一步的尝试。
导师对预审后论文修改情况的意见:
对多阶统计量和模式变量的计算结果做了进一步的探讨。
合并了部分相关章节的内容,突出了工作重点。
加强了实际体系应用的理论指导。
导师签名:
年月日
攻读博士学位期间已经发表〔包括已接受待发表〕的论文、或已通过鉴定的项目、或已申请到的专利填入下表
序
号
作者〔全体作者,按顺序排列〕
发表论文题目/
获奖成果名称
刊物名称/
授奖部门、级别
发表/
获奖时间
对应学位
论文章节
与学位论文关联度〔此栏由论文评阅人填写,请打“√”〕
大
较
大
中
小
无
1
唐凯临,李通化
ApplicationofKernelMethodtoClassifySELDI-TOFProteomicsData
电脑与应用化学
2007
3
√
2
唐凯临,李通化
卵巢癌SELDI-TOF数据分类方法初探
2006年全国博士生学术论坛
2006
3
√
3
Tangkailin,Litonghua
Classificationofproteomicsdatabykernelmethods
AbstractsofPapers,233rdACSNationalMeeting
2006
4
√
4
Tangkailin,Litonghua
Patternvectorsforfeatureextractioninlargescaledatasets
AbstractsofPapers,234rdACSNationalMeeting
已接收
5
√
5
姚微佳,李通化,唐凯临
用于癌症诊断的基因芯片数据降维和分类方法
中国电脑大会
2005
6
√
6
唐凯临,李通化,陈开
多肽保留时间预测的研究
电脑与应用化学
已排版
7
√
7
Tangkailin,Litonghua
QuantitativestructureretentionrelationshipstudiesofPCDD/FsondiversestationaryGas
ProceedingsofComputationalMethodsinToxicology&PharmacologyIntegratingInternet
2005
8
√
8
Tangkailin,Litonghua,Chenkai
QSARStudyonPCDD/FsbyUsingKernelPLS
ChemicalResearchinChineseUniversities
已修回
8
√
9
Tangkailin,Yuhongxia,Litonghua
MolecularDockingandQSARStudiesonCyclin-DependentKinase2Inhibitors
ProceedingsofInternationalConferenceonChemometricsandBioinformaticsinAsia
2004
9
√
〔可加页〕
注:
关联度栏必须由论文评阅人填写评阅人签名:
博士学位论文定量评价表
评审项目
权重
评分标准
得分
〔百分制〕
一、论文
选题〔A〕
10%
90分以上
选题有重要的理论意义或实用价值
75~89分
选题有较大的理论意义或实用价值
60~74分
选题有一定的理论意义或实用价值
60分以下
选题缺乏理论意义或实用价值
二、文献
综述〔B〕
10%
90分以上
阅读广泛、综述全面、掌握国内外动态
75~89分
阅读较广泛、综述较全面、基本掌握国内外动态
60~74分
阅读广泛、综述一般、了解国内外动态
60分以下
阅读量不够、综述一般、基本了解国内外动态
三、理论基础和专门知识〔C〕
20%
90分以上
掌握坚实宽广的理论基础和系统知识
75~89分
较好地掌握理论基础和系统知识
60~74分
基本掌握理论基础和系统知识
60分以下
掌握理论基础和系统知识较差
四、科研能力与业务水平〔D〕
20%
90分以上
有很强的科研工作能力和业务水平
75~89分
有较强的科研工作能力和业务水平
60~74分
有一定的科研工作能力和业务水平
60分以下
科研工作能力差,缺乏业务水平
五、研究成果的创新性〔E〕
30%
90分以上
研究成果具有很强的创新性
75~89分
研究成果具有较强的创新性
60~74分
研究成果创新性不明显
60分以下
研究成果不具有创新性
六、写作
能力〔F〕
10%
90分以上
条理清晰,分析严谨,文笔流畅
75~89分
条理较好,层次分明,文笔顺通
60~74分
写作能力尚可
60分以下
写作能力较差
总分
总分=0.1A+0.1B+0.2C+0.2D+0.3E+0.1F
备注:
每位专家对六项指标按百分制评分。
评阅人对学位论文的学术评语:
〔包括选题意义;文献资料的掌握;所用资料、实验结果和计算数学可靠性;论文创新成果内容及写作标准化和逻辑性。
注意对论文中可能存在的剽窃、论据作假等把好关,如果发现请详细说明〕
随着生命科学研究热潮的到来和现代仪器分析的飞速发展,积累了大量的生物数据。
这类数据最大的特点是变量往往比样本多出2-3个数量级,因此称为海量数据或者超大规模数据。
如何从这类数据中挖掘更多有价值的信息是对生物信息学和化学信息学的巨大挑战。
而对于这类数据的处理,有许多困难要解决,比方如何从大量数据中剔除无用和冗余的数据信息、适当的选择变量、解决“维数灾难”等问题等。
这一系列问题的解决,就有必要尝试新的数据处理的思路和方法。
唐凯临论文《变量选择和变换的新方法研究》,针对变量选择和变换,做了一系列有意义的尝试性、探索性工作。
论文的创新表达在以下几个方面:
1.对于多变量少样本的超大规模数据,提出先将其利用函数映射至特征空间,经转换之后的变量以样本之间的关系代替了原先的变量之间的关系。
通过这种变换,在原样本空间用线性方法难以解决的问题,在特征空间中就可以解决了。
文中涉及的KPLS方法,为多变量少样本问题的解决提供了一个新途径。
2.对大量的生物样品测得的质谱数据,提出多阶统计量变换的方法。
就是将质谱数据分为假设干区间,计算每个区间的多阶统计量(即均值、方差等统计量),以这些反映了波形特点的多阶统计量作为新的变量进行分类计算。
完成了降维,同时研究也说明该方法可以使分类效果也得到进一步提高。
3.为了反映出特征变量的具体奉献,论文提出了一种对连续变量进行转换从而寻找特异模式的方法。
这样进一步减少了了变量数,并由模式组合构成模式变量。
论文中提出的方法,已经用于解决复杂疾病的诊断(卵巢癌等)、计算蛋白质组学、dioxins等环境污染物性质预测和药物辅助设计等研究。
这说明该工作不仅具有理论意义,也有较好的应用前景。
作者对预审中提出的意见作了很好的反馈,论文的格式也更加标准。
作者查阅了大量国内外有关文献,且大多数为国际学术刊物的相关工作,文调研较为系统全面。
从论文内容可看出作者已较好地掌握了专业基础知识。
文中方法数学推导严密、结果可靠。
论文内容充实、编排合理,逻辑性较强。
作者已具备了较强的独立开展科研工作的能力。
论文已经到达了博士学位论文的要求,同意答辩。
论文存在的主要不足之处与评阅人的建议
是否同意举行学位论文答辩
〔请在相应的栏目内划“√”〕
同意〔〕,修改后答辩〔〕,未到达答辩要求〔〕
评阅人
签名
技术职称
评阅人
工作单位
是否博导
联系
地址
〔E-mail〕
评阅日期
年月日