1、博士学位论文答辩评阅意见书博士学位论文答辩评阅意见书论文题目: 变量选择和变换的新方法研究 博 士 生: 唐凯临 学 号: * 院(系、所): 化学系 专 业: 无机化学 指导教师: 李通化 教授 年 月 日 教授:鉴于您在本学科的造诣和学术声望,特聘请您对我校 化学系 无机化学 专业博士生 唐凯临 的学位论文进行评阅。现呈上该生论文,请您在百忙中抽时间给予审阅(请重点审阅论文的创新性、学术性)。并将评阅意见于 年 月 日前邮寄或送达博士生所在 学院 收地址:上海市四平路1239号 邮政编码:200092 谢谢您的支持!同济大学研究生院(学院代章)申请人姓名唐凯临专业 无机化学 入学年月 20
2、04.3 论文题目变量选择和变换的新方法研究申请人对学位论文的自评序号主要创新点(每点不超过100字)1 对于多变量少样本的超大规模数据先将其利用函数映射至特征空间,经转换之后的变量以样本之间的关系代替了原先的变量之间的关系。这样许多在原样本空间用线性方法难以解决的问题,在特征空间中可以轻而易举地完成。2 将质谱数据分为若干区间,计算每个区间的多阶统计量,以这些反映了波形特点的多阶统计量作为新的变量进行分类计算。不仅大大减少了变量还使用了数据的局部信息,分类效果也得到进一步提高。3 提出了一种将连续变量转换成离散变量从而寻找特异模式的方法。首先将连续变化的谱转为离散变量。然后经过模式生成,模式
3、比较,模式精化,找到肿瘤和正常两类各自特有的模式,得到有意义的生物标记物。申请人对学位论文的自评不足之处(含原因及改进方法)1、核函数在本文的分类和回归问题中起着非常重要的作用。不同的核函数往往对拟合结果有很大影啊。对于核函数类型,本文中还是凭经验选择,目前还没有系统的理论指导方法,这一方面需要进一步的理论研究。2、模式变量选择中对于区间的划分、多种模式选择的方法还需要进一步的研究。对于多种蛋白的共同作用,biomarker的确定还需要生物化学实验的确认。 3、分子对接结果用于QSAR研究还需要进一步的尝试。导师对预审后论文修改情况的意见:对多阶统计量和模式变量的计算结果做了进一步的探讨。合并
4、了部分相关章节的内容,突出了工作重点。加强了实际体系应用的理论指导。 导师签名: 年 月 日攻读博士学位期间已经发表(包括已接受待发表)的论文、或已通过鉴定的项目、或已申请到的专利填入下表序号作者(全体作者,按顺序排列)发表论文题目/获奖成果名称刊物名称/授奖部门、级别 发表/获奖时间对应学位论文章节与学位论文关联度(此栏由论文评阅人填写,请打“”)大较大中小无1唐凯临,李通化Application of Kernel Method to Classify SELDI-TOF Proteomics Data计算机与应用化学200732唐凯临,李通化卵巢癌SELDI-TOF数据分类方法初探200
5、6年全国博士生学术论坛200633Tang kailin,Li tonghuaClassification of proteomics data by kernel methodsAbstracts of Papers, 233rd ACS National Meeting200644Tang kailin,Li tonghuaPattern vectors for feature extraction in large scale datasetsAbstracts of Papers, 234rd ACS National Meeting已接收55姚微佳,李通化,唐凯临用于癌症诊断的基因芯
6、片数据降维和分类方法中国计算机大会200566唐凯临,李通化,陈开多肽保留时间预测的研究计算机与应用化学已排版77Tang kailin,Li tonghuaQuantitative structure retention relationship studies of PCDD/Fs on diverse stationary GasProceedings of Computational Methods in Toxicology & Pharmacology Integrating Internet200588Tang kailin,Li tonghua,Chen kaiQSAR Stu
7、dy on PCDD/Fs by Using Kernel PLSChemical Research in Chinese Universities已修回89Tang kailin,Yu hongxia,Li tonghuaMolecular Docking and QSAR Studies on Cyclin-Dependent Kinase 2 InhibitorsProceedings of International Conference on Chemometrics and Bioinformatics in Asia20049(可加页)注:关联度栏必须由论文评阅人填写 评阅人签名
8、: 博士学位论文定量评价表评审项目权重评分标准得分(百分制)一、论文选题(A)10%90分以上选题有重要的理论意义或实用价值7589分选题有较大的理论意义或实用价值6074分选题有一定的理论意义或实用价值60分以下选题缺乏理论意义或实用价值二、文献综述(B)10%90分以上阅读广泛、综述全面、掌握国内外动态7589分阅读较广泛、综述较全面、基本掌握国内外动态6074分阅读广泛、综述一般、了解国内外动态60分以下阅读量不够、综述一般、基本了解国内外动态三、理论基础和专门知识(C)20%90分以上掌握坚实宽广的理论基础和系统知识7589分较好地掌握理论基础和系统知识6074分基本掌握理论基础和系统
9、知识60分以下掌握理论基础和系统知识较差四、科研能力与业务水平(D)20%90分以上有很强的科研工作能力和业务水平7589分有较强的科研工作能力和业务水平6074分有一定的科研工作能力和业务水平60分以下科研工作能力差,缺乏业务水平五、研究成果的创新性(E)30%90分以上研究成果具有很强的创新性7589分研究成果具有较强的创新性6074分研究成果创新性不明显60分以下研究成果不具有创新性六、写作能力(F)10%90分以上条理清晰,分析严谨,文笔流畅7589分条理较好,层次分明,文笔顺通6074分写作能力尚可60分以下写作能力较差总分总分0.1A+0.1B+0.2C+0.2D+0.3E+0.1
10、F备注:每位专家对六项指标按百分制评分。评阅人对学位论文的学术评语:(包括选题意义;文献资料的掌握;所用资料、实验结果和计算数学可靠性;论文创新成果内容及写作规范化和逻辑性。注意对论文中可能存在的剽窃、论据作假等把好关,如果发现请详细说明)随着生命科学研究热潮的到来和现代仪器分析的飞速发展,积累了大量的生物数据。这类数据最大的特点是变量往往比样本多出2-3个数量级,因此称为海量数据或者超大规模数据。如何从这类数据中挖掘更多有价值的信息是对生物信息学和化学信息学的巨大挑战。而对于这类数据的处理,有许多困难要解决,比如如何从大量数据中剔除无用和冗余的数据信息、适当的选择变量、解决“维数灾难”等问题
11、等。这一系列问题的解决,就有必要尝试新的数据处理的思路和方法。唐凯临论文变量选择和变换的新方法研究,针对变量选择和变换,做了一系列有意义的尝试性、探索性工作。论文的创新体现在以下几个方面:1.对于多变量少样本的超大规模数据,提出先将其利用函数映射至特征空间,经转换之后的变量以样本之间的关系代替了原先的变量之间的关系。通过这种变换,在原样本空间用线性方法难以解决的问题,在特征空间中就可以解决了。文中涉及的KPLS方法,为多变量少样本问题的解决提供了一个新途径。2.对大量的生物样品测得的质谱数据,提出多阶统计量变换的方法。就是将质谱数据分为若干区间,计算每个区间的多阶统计量(即均值、方差等统计量)
12、,以这些反映了波形特点的多阶统计量作为新的变量进行分类计算。完成了降维,同时研究也表明该方法可以使分类效果也得到进一步提高。3.为了反映出特征变量的具体贡献,论文提出了一种对连续变量进行转换从而寻找特异模式的方法。这样进一步减少了了变量数,并由模式组合构成模式变量。论文中提出的方法,已经用于解决复杂疾病的诊断(卵巢癌等)、计算蛋白质组学、dioxins等环境污染物性质预测和药物辅助设计等研究。这表明该工作不仅具有理论意义,也有较好的应用前景。作者对预审中提出的意见作了很好的反馈,论文的格式也更加规范。作者查阅了大量国内外有关文献,且大多数为国际学术刊物的相关工作,文调研较为系统全面。从论文内容可看出作者已较好地掌握了专业基础知识。文中方法数学推导严密、结果可靠。论文内容充实、编排合理,逻辑性较强。作者已具备了较强的独立开展科研工作的能力。 论文已经达到了博士学位论文的要求,同意答辩。论文存在的主要不足之处与评阅人的建议是否同意举行学位论文答辩(请在相应的栏目内划“”)同意( ),修改后答辩( ),未达到答辩要求( )评阅人签名技术职称评阅人工作单位是否博导联系地址电话(E-mail)评阅日期年 月 日
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1