数据挖掘技术在中医证候学研究中的应用.docx
《数据挖掘技术在中医证候学研究中的应用.docx》由会员分享,可在线阅读,更多相关《数据挖掘技术在中医证候学研究中的应用.docx(9页珍藏版)》请在冰豆网上搜索。
数据挖掘技术在中医证候学研究中的应用
辨证论治是中医理论和临床体系的重要支撑,贯穿于对疾病诊断、治疗、康复、疗效评价的全过程。
“证候”乃是从整体性出发,对个体疾病状态下特征的描述以及对疾病内在变化规律的概括,是中医有别于现代医学诊疗体系的一大特色和优势。
自上世纪50年代辨证论治的研究热潮兴起后,中医证候研究取得了一些进展,但仍没有找到合适的方法和途径。
如何从临床信息调查和分析中获取可靠的数据来支持中医证候理论,以及如何将中医药的优势按现代主流医药界能够理解的科学语
言拿出证据来,是中医药走向世界的重要策略[1]。
1数据挖掘技术在现代中医证候学研究中的运用目前的数据库系统可以高效地实现数据的录入、查
询和统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。
数据挖掘技术是一种揭示工具,借鉴其方法来研究中医证候的构成特点及规律,可加强与其他学科的交流与对话。
1.1医学多元统计学多元分析是定量分析事物复杂
关系的一种数理统计方法。
目前,人们在中医药研究中运用的多元分析方法主要有聚类分析法、判别分析法、回归分析法、因子分析法、相关分析法等。
多元分析在中医药研究中的应用日趋广泛并凸现其重要性,尤其在证
张
琴1
刘平2张文彤3
1.复旦大学附属上海市公共卫生中心
(上海
2015082.上海中医药大学肝病研究所
(上海
201203
3.复旦大学上海医学院(上海
200032
数据挖掘技术在中医证候学研究中的应用
【摘要】综述近10年综合运用临床流行病学与卫生统计学、数学、信息科学、人工智能学科等数据挖掘技术在中
医证候学研究中的应用成果,并进行相应的评价。
提出应遵循现代循证医学的基本原则,充分考虑中医自身的特点,运用现代调查研究的基本方法,病证结合,以现代疾病为限定范围(在明确诊断及排除标准的基础上,规范、细致、较全面地采集中医以症状为主的四诊信息及相关检查数据,同时紧密结合临床治疗效果,动态观察证候在中药治疗干预下的演变规律,为建立中医辨证论治的疗效评价体系提供思路、方法与科学资料。
【关键词】
证候学;辨证论治;数据挖掘
【中图分类号】
R2-02;R195.1【文献标识码】B【文章编号】1007-1334(200603-0003-03
Abstract:
Inthisarticle,itoutlinedandappraisedtheapplicationresultsoftheTCMsyndromebythewayofdataminingmethodbyapplyingsyntheticallymodernclinicalepidemiologywithmedicalstatistics,mathematics,informationscienceandartificialintelligencewithintherecenttenyears.Itraisedtheideaof,accordingtothecharacteristicsofChinesemedicineitself,ap-plyingthebasicwayofmoderninvestigationandstudy,combingthediseaseswiththesyndrome,whichwerelimitedinthescopeofmoderndisease(onthebasisofconfirmeddiagnosisandexcludingstandard,whichrequiredthenormal,accurateandcomprehensivecollectionoffourdiagnosingmethodsinformationandrelateddata.Meanwhile,wealsocombinewithclini-caleffect,observingdynamicallytheruleofthesyndromerevolutionthatweretreatedbydifferentherbalprescription,whichwouldofferussomenewconceptsandmethodstobuildanevaluationsystemofTCM.KeyWords:
ThetheoryofTCMsyndrome;treatmentbasedonsyndromedifferentiation;datamining
AnApplicationofDataMiningintheResearchofTCMSyndromeTheories
ZHANGQin1
LIUPing2
ZHANGWen-Tong3
1.ShanghaiPublicHealthCenterAffiliatedtoFudanUniversity
2.InstituteofLiverDisease,ShanghaiUniversityofTCM
3.ShanghaiMedicalCollege,FudanUniversity
[基金项目]上海市卫生局资助项目(034056
[作者简介]张琴(1965-,女,上海人,博士,副主任医师,主要从事中医肝病的临床研究工作。
辨证论治
候学方面的研究。
1.1.1聚类分析法聚类分析是研究“物以类聚”的数理统计方法。
张世筠等[2]运用流行病学和变量聚类分析的数理统计方法,将中医肝证的11个主要证型最后分类为实证、风证和虚证等3类。
研究结果不仅科学地解决了中医肝证的分类层次问题,而且从统计学角度明确了中医肝证分类的正确性。
张琴等[3]运用SAS软件对223例患者进行系统聚类和主成分分析,并结合专业知识对肝炎肝硬化中医常见的证候作出判别:
第一类型表现为以实证为主兼见虚证,第二类型、第三类型表现为以虚证为主兼见邪实。
并显示湿热内蕴、血瘀阻络、气阴两虚为肝炎肝硬化的主要病机。
邓兆智等[4]根据163例类风湿性关节炎患者头发微量元素的检测结果,采用动态聚类法在多维空间进行分类,可以得出5种证型。
梁雄伟等[5]对221例中风急性期患者证候特点等进行了指标聚类,结果可分为4类。
1.1.2判别分析法判别分析法是根据某些指标的观测值对所研究的对象判断其归属类别的一种统计分析方法,中医药研究中的应用主要集中在诊断、证候以及病的计量研究方面。
王洁贞、陈东汉等[6 ̄7]利用脉图数据对平、弦、滑等脉的诊断,采用逐步判别分析法、最大似然法、Fisher逐层判别分析法等3种多因素分析方法建立判别式,结果符合程度较高。
陈群[8]将确诊的冠心病分为阳气虚与气阴虚,用逐步判别法选用脉图参数指标建立判别式,并进行主成分分析,结果回代符合率分别为8
2.00%和94.25%。
罗文豪等[9]用Bayes公式法等对720例慢性支气管炎肺、脾、肾虚证进行中医辨证的计量诊断,并建立用以判别各证型的证候频率及指数表。
吴圣贤等[10]对630例老干部体检资料进行脑动脉硬化症(CAS的计量诊断研究,建立的CAS中医辨证计量诊断的判别式对阴虚阳亢证和气虚血瘀证具有良好的诊断效能。
陈东汉等[11]用逐步判别分析法对脉图参数59个指标中能对分类起显著作用的6个指标建立判别式,判别高血压病与冠心病并发高血压病的正确率为91.03%。
李小兵等[12]将1192例心脑血管病患者分为痰证组与非痰证组,建立心脑血管病宏观辨证的判别方程,回代结果较好。
1.1.3回归分析回归分析是研究随机变量之间的统计相关关系的一种数理统计方法。
王阶等[13]对92例冠心病进行逐步回归分析,确认全血黏度、总胆固醇等5个因素对冠心病血瘀证的贡献最大,提示血瘀证的研究应在系统研究中确定其普遍性指标和特征性指标。
严云良等[14]对《中医养生大全》中的8种养脾中药方中白
术、茯苓、人参的配伍用量规律进行分析,得到3者配伍用量规律的回归方程。
刘凤斌等[15]用Logistic逐步回归分析方法模拟专家对脾胃病诊断过程,结果与专家诊断的总符合率为88%。
1.1.4多元分析在中风病证候研究中的应用近年来在临床常见疾病的证候研究中,通过降维升阶的工作方法,使证候诊断呈现出一种复杂的立体交叉的组合关系。
这正符合患者特殊个体差异及医生灵活运用的需要。
国家科委科技攻关项目的“中风病证候学与临床诊断的研究”[16],是一个较好的范例,研究建立了中风病“风、火、痰、瘀、气虚、阴虚阳亢”等6个中医证候因素,在制定证候诊断标准的时候,只做6种,而在具体的临床应用中,可以组合出54种证候。
这是一种经过优化的研究方法,值得进一步探讨。
1.2人工智能方法由于传统的医学统计方法具有局限性,研究者们开始尝试运用模糊智能技术探索中医证候分类及疗效评估的方法。
应用数学建模、神经网络、基于案例的推理、图像处理、遗传算法、智能数据与时序分析、模式识别等多种技术深入地研究某种疾病,以建立更为实用、高效的疾病诊断智能系统。
同时对疗效评价、方案选优之类的问题进行辅助决策,充分发挥了数值分析的优势,即定量和定性的分析。
1.2.1模糊数学模型应用李波等[17]根据关幼波先生鉴别各种肝炎病的经验,运用有关统计数据建立肝炎病诊断的模糊数学模型,在中医的肝炎病诊断中引进了模糊子集的概念,在此基础上利用电子计算机建立了对应的专家系统。
张德舜等[18]在对183例慢性胃肠病观察的基础上,辨为6种证型,用评分赋值法进行分级,建立数学模型,用模糊综合评判法对辨证分型分级进行综合评判,为中医辨证论治的量化研究提供了一种方法。
廖云龙[19]从《伤寒论》六经的生理、病理等方面论述了六经辨证的模糊性,认为这种模糊性是《素问》的三位逻辑向多位逻辑思维方式的发展,将有助于对六经实质的探索。
1.2.2基于神经网络的运用周志坚等[20]构造了一个神经网络分级系统,并用于类风湿性关节炎寒热错杂证的病情分级诊断,初步探讨了神经网络用于中医诊断中的可行性。
边沁等[21]的研究表明,神经网络用于证候的规范化研究具有方法上的可行性。
王炳和[22]研究建立了一个8-5-7三层结构的脉象人工神经网络模型,经280例脉象的识别检验,结果表明,对7种脉象的识别准确率平均为87%。
因此,选择合适的工具对中医药大量数据进行多层面智能分析,是进一步更新和完善中医
药知识的有效途径[23]。
1.3中医临床疗效评价的思路与方法辨证的意义在
于对患者实施恰当的治疗,而目前的中医药临床疗效评价的体系仍在探索阶段。
郭新峰等[24]总结了我国临床试验中结局指标选择的现状及与国外的差距,认为只有选择对患者有直接影响的主要结局指标才能够证实干预措施的真正疗效,以实验室检验为主的生物学指标只是一种次要结局指标,只有在主要结局指标不可行、次要结局指标被证实与主要结局指标具有因果关系的情况下才能作为代替主要结局指标的替代指标使用。
并同时指出临床研究中亟待注意的事项:
应尽快引进与完善功能与生存质量的评价方法;寻找能发挥中医药优势的证候相关指标;分清主要结局指标与次要结局指标的临床意义,严格进行结论推导。
这是坚持循证医学基本原则前提下如何突出中医辨证论治特色的问题。
2评述和展望
中医证候诊断系统是一个非线性的、多维多阶的可
以无限组合的复杂巨系统,用线性研究的方法则无法真正来规范它
[25]
。
模糊技术在中医知识的数据挖掘方面
有较强的优越性,它的核心是规则,是传统统计分析方法的延伸和扩展,可以完成传统统计学无法完成的重要工作。
但在制定证候诊断标准时要立足于望、闻、问、切四诊收集的资料,并逐步引进四诊客观化研究和客观辨证研究的成果,不断充实提高;在系统研究中要坚持科学性与实用性统一、先进性与广泛性统一、创新性与可行性统一的基本原则,运用经过筛选优化的方法,坚持循证医学的基本原则,充分考虑辨证论治的基本特点,病证结合,以现代疾病为限定范围(在明确诊断及排除标准的基础上,紧密结合疾病的主要结局指标,从中医证候的动态性特点出发,以临床疗效为评判标准,探求证候演变规律及其病-证-效的科学依据,为构建辨证论治的规范寻求科学证据和研究方法。
参考文献:
[1]蒋文跃.预防性药物时代的到来———
中医药走向世界的最佳契机[J].中国中西医结合杂志,2004,24(5:
464-467.
[2]张世筠,沈明秀,王先春,等.中医肝证的变量聚类分析[J].中国中
西医结合杂志,2004,24(1:
75-76.
[3]张琴,刘平,曹素华,等.肝炎后肝硬化中医证候的多元分析[J].中
西医结合肝病杂志,2003,13(2:
69-72.
[4]邓兆智,何羿婷,余煜棉,等.计算机模式识别法在类风湿性关节炎
中医证候诊断与常规临床判断的比较[J].中国中西医结合杂志,
1996,12:
727.
[5]梁雄伟,温泽雄,欧爱华,等.中风急性期中医证候多元分析[J].广
州中医药大学学报,1998,15(4:
293.
[6]王洁贞,束怀符,肖珙.几种常见中医脉象的计量诊断方法[J].山东
医学院学报,1983,21(4:
22-35.
[7]陈东汉,蔡元东.中医弦脉的计量诊断初步探讨[J].福建中医药,
1986,17(4:
33-36.
[8]陈群.多元分析在冠心病脉图计量诊断中的应用[J].广州中医学院
学报,1989,6(1:
31-35.
[9]罗文豪,林求诚.中医辨证的计量诊断[J].福建中医药,1989,20(1:
41-43.
[10]吴圣贤,林求诚,王永炎.脑动脉硬化症中医辨证计量诊断的回顾
性研究[J].北京中医药大学学报,2001,24(1:
59.
[11]陈东汉,陈文发.脉图在高血压病和冠心病的计量诊断中的应用
[J].福建中医药,1987,18(4:
24-26.
[12]李小兵,方永奇,洪永敦,等.心脑血管病痰证宏观辨证的计量化研
究[J].中国中医基础医学杂志,2000,6(5:
44.
[13]王阶,陈可冀,翁维良.冠心病血瘀证逐步回归分析[J].中西医结
合杂志,1991,11(1:
47-49.
[14]严云良,李大庆.养脾中药方的数理统计分析[J].浙江中医学院学
报,1997,21(5:
50.
[15]刘凤斌,郝元涛,方积乾.Logistic逐步回归分析方法在模拟专家辨
证诊断中的应用研究[J].中国中医基础医学杂志,2001,7(2:
58-59.[16]张志斌,王永炎.证候名称及分类研究的回顾与假设的提出[J].北
京中医药大学学报,2003,26(2:
1-5.
[17]李波,钟智.肝炎病诊断的模糊数学模型[J].广西医科大学学报,
1998,15(1:
52.
[18]张德舜,余贵清,冷晓东.慢性胃肠病中医辨证分型分级及其量化
与评判[J].中医研究,1993,6(3:
19-21.
[19]廖云龙.从模糊理论看六经辨证[J].广州中医学院学报,1990,7
(1:
1-3.
[20]周志坚,毛宗源,邓兆智.神经网络在类风湿性关节炎病情分级中
的应用初探[J].生物医学工程学杂志,1999,16(4:
479-482.[21]边沁,何裕民,施小成,等.基于MFB-P算法的中医证型的神经网
络模型初探[J].中国中医基础医学杂志,2001,7(1:
386-389.[22]王炳和,相敬林.基于神经网络方法的人体脉象识别研究[J].西
北工业大学学报,2002,(20:
14.
[23]姚美村,袁月梅,艾路,等.数据挖掘及其在中医药现代化研究中
的应用[J].北京中医药大学学报,2002,25(5:
20-23.
[24]郭新峰,赖世隆,梁伟雄.中医药临床疗效评价中结局指标的选择
与应用[J].广州中医药大学学报,2002,19(4:
251-255.
[25]盂庆刚,王永炎,戴汝为.系统复杂性的中医证侯规范化研究探析
[J].中医药学刊,2003,21(12:
2015.
编辑:
李艳红收稿日期:
2005-11-23
欢迎订阅!
欢迎投稿!
欢迎投放广告!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
"
!
!
!
!
!
!
"
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
"
!
!
!
!
!
!
"