基于盒维数原理计算蛋白质的分形维数汇总.docx

上传人:b****4 文档编号:3812527 上传时间:2022-11-25 格式:DOCX 页数:12 大小:124.94KB
下载 相关 举报
基于盒维数原理计算蛋白质的分形维数汇总.docx_第1页
第1页 / 共12页
基于盒维数原理计算蛋白质的分形维数汇总.docx_第2页
第2页 / 共12页
基于盒维数原理计算蛋白质的分形维数汇总.docx_第3页
第3页 / 共12页
基于盒维数原理计算蛋白质的分形维数汇总.docx_第4页
第4页 / 共12页
基于盒维数原理计算蛋白质的分形维数汇总.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

基于盒维数原理计算蛋白质的分形维数汇总.docx

《基于盒维数原理计算蛋白质的分形维数汇总.docx》由会员分享,可在线阅读,更多相关《基于盒维数原理计算蛋白质的分形维数汇总.docx(12页珍藏版)》请在冰豆网上搜索。

基于盒维数原理计算蛋白质的分形维数汇总.docx

基于盒维数原理计算蛋白质的分形维数汇总

2010年第68卷

化学学报

Vol.68,2010第11期,1143~1147

ACTACHIMICASINICA

No.11,1143~1147

*E-mail:

qiwei@

ReceivedSeptember4,2009;revisedDecember2,2009;acceptedJanuary25,2010.

国家自然科学基金(No.20976125、863(No.2008AA10Z318、教育部新世纪优秀人才(2008和科学技术研究重点(No.108031资助项目.

·研究简报·

基于盒维数原理计算蛋白质的分形维数

彭鑫a张雨薇a齐崴*,a,b苏荣欣a,b

吴少敏a,b何志敏a,b

(a天津大学化工学院化学工程研究所天津300072(b天津大学化学工程联合国家重点实验室天津300072

摘要蛋白质表面的粗糙性和内部结构的不规则性具有明显的分形特征.依据直观的盒维数原理对PDB库中收录的典型酶蛋白、球蛋白和膜蛋白共72种蛋白质的分形维数进行了简洁地模拟计算.数据表明:

蛋白质的分形维数(Df介于1~3之间;分形方法可定量描述蛋白质分子结构的复杂性,即Df值越大,蛋白结构越复杂;Df与残基数的不同步性证明蛋白质分子并不是简单的肽段堆积,而是存在特定的空间结构;同功能酶蛋白具有相近的Df值表明分维是区别于各种宏观参量而对蛋白质微观结构与功能进行表征的有用工具.关键词分形;蛋白质;盒维数;模拟;计算;结构

FractalAnalysisofProteinsBasedonBoxDimension

Peng,XinaZhang,YuweiaQi,Wei*,a,bSu,Rongxina,b

Wu,Shaomina,bHe,Zhimina,b

(aChemicalEngineeringResearchCenter,SchoolofChemicalEngineeringandTechnology,Tianjin300072

(bStateKeyLaboratoryofChemicalEngineering,TianjinUniversity,Tianjin300072

AbstractProteinswithroughsurfacesandirregularstructuresarecharacteristicoffractalnature.Fractaldimensionsofasetof72proteinsincludingtypicalenzyme,globulinandmembraneproteinselectedfromPDBdatabasewerecalculatedbasedontheprincipleofintuitiveboxdimension.Theresultsshowedthatfractaldimensionsofproteinswerebetween1and3,andthemorecomplicatedstructureaproteinhas,thelargervalueoffractaldimensiontheproteinis,sothefractaltheorycouldbeusedtoquantitativelydescribethecomplexityofproteinsstructure.Thediscordancebetweenfractaldimensionsandthenumberofresiduesdemonstratedthatproteinsnotonlywerecomposedofpeptidechains,butalsohadthespecificallyspatialstructure.ThecloseDfvaluesoftheenzymeswithsimilarfunctionindicatedthatDf,differedfromavarietyofmacro-parameters,wasausefultoolforthecharacterizationofmicro-structureandfunctionofproteins.Keywordsfractal;protein;boxdimension;simulation;calculation;structure

蛋白质是生物体内各种生命活动的主要参与者.为体现不同的生理功能,蛋白质的空间结构极为独特复杂,并在一定标度范围内表现出明显的分形(Fractal特征[1~3],这是由其自身组成规律与结构特点所决定的,例如:

从蛋白质的链结构分析,其链段是一条弯曲的折

线,而弯曲的形态不随观测尺度的变化而改变,这是一种统计意义上的相似性或称标度不变性,属分形分析研究的对象;又如:

从蛋白质空间立体结构分析,其分子内具有各种不规则的“洞穴”、“缝隙”和“折皱”,进一步观测发现这些微观结构内部也是凹凸不平、极不规

1144

化学学报Vol.68,2010

则的,即蛋白质具有极强的局部与整体相似性,这是明显的分形特征,属分形理论研究的范畴.同时计算科学的飞速发展,为分形维数的模拟计算提供了可能,部分学者[1~3]通过蛋白质分子链长L(M与测量残基数M之间的幂函数关系1(DLMM∝f-(Df为链分形维数,求得许多蛋白质分子的分形维数,结果大多介于1~3之间[1~6].盒维数法也是较常用的计算分形维数的方法,它因计算简便、形象直观,应用极为广泛,但当其用于计算蛋白质的分维时,几乎均需借助实验获得的图像再经软件处理方能得到实验结果

[7~9]

.

本文根据分形理论中的盒维数原理对PDB库中收录的多种酶蛋白、球蛋白和膜蛋白的分形维数进行纯模拟计算,并剖析分维与结构的关系,相关工作可为蛋白质结构与功能关系的研究提供有益参考和新的思路.

1模拟原理

盒维数(BoxDimension作为分形维数的一种,比豪斯多夫维数更容易计算,是分形分析中较为直观实用的一种,实际应用中可形象地理解为在集合F中(可以是面或体,构造一些边长为δ的正方形(体或称为盒子,并用其去覆盖集合,计算不同δ值的“盒子”和F相交的个数N(δ,由N(δ与δ在双对数坐标系中直线的斜率值可求得盒维数[10,11].

本文采用的模拟方法如下:

首先从PDB数据库中搜索到目标蛋白质分子的结构文件

[12]

将其分子中各

原子坐标记为Pi(xi,yi,zi.检测坐标值,得到这些原子坐标中的最大值Amax=max(xmax,ymax,zmax和最小值Amin=min(xmin,ymin,zmin,令δt(t=0,1,...,n-1为取定尺码且:

maxmin

(1,2,,tAAtnt

δ"-=

 =(1

生成n种不同的边长为δt的正方体盒子,用来覆盖整个坐标空间,设第n个盒子中的原子个数为N(δt,则随着δt的不断减小,得到一系列δt和相应的N(δt,(t=0,1,…,n-1.采用最小二乘法对[logδt,logN(δt]作一元线性回归分析,可得到该蛋白分子的盒维数Df:

1

20[log(log]/lognntttiifDNδδδ−⋅∑∑-1

==0

=(2

模拟原理如图1所示.上述模拟计算可利用MATLAB编程实现,进而求得各种蛋白质分子的分形维数

.

图1基于盒维数原理计算蛋白质分形维数的示意图Figure1Fractalcalculationofproteinsbasedonboxdimen-sion

(aBovinehemoglobin(1G08;(bHumanserumalbumin(1A06

2模拟结果

选择PDB库中大量代表性酶和蛋白质的结构文件,

计算得到这些蛋白质分子的分形盒维数(表1,同时记录该分子的PDBID,残基数,可及表面积和分子体积.

3分析与讨论

3.1维数范围

所得蛋白质的分形维数(1,3fD∈,这和很多学者的研究吻合.如果将肽段视为一维线状结构,那么二级结构的维数一定大于1,但又无法达到二维平面的维数,因此各种二级结构的维数处于1~2之间,同理更高级的空间结构具有比二级结构更大的维数,但即使是空间四级结构,也无法形成充实的三维体系.因此,蛋白质的分形维数(1,3fD∈.

3.2维数规律

维数是对体系粗糙度的一种表征,即维数越大体系

越粗糙[13~16].对于蛋白质而言,分形维数Df越大,该分子将具有越复杂的空间结构.在表1中牛血红蛋白(BovineHemoglobin,第70号是相对较为复杂的生物大分子,具有四级结构,因此其分形维数Df也是模拟结果中极大的;相反,一些结构简单的蛋白分子,其功能较单一,结构层次也较简单,因此分形维数Df相对较小

(不大于2,如:

膜蛋白.此外,本文中72种蛋白质的平均分形维数Df为2.12,接近于随机运动的分形维数2[5,6].

No.11

彭鑫等:

基于盒维数原理计算蛋白质的分形维数1145

表1蛋白质分子分形结构盒维数模拟计算结果Table1Calculatedboxdimensionofproteins

ProteinsPDBIDThenumberofresiduesAccessible

surfacearea/nm2

Volume/nm3

Fractal

dimensionDf

No.Reducedsuperoxidedismutase1SXA15159.7517.7141.937631Superoxidedismutase1E9O15258.8717.5161.986862Glutathioneperoxidase1GP1

19872.7024.3432.081313

Catecholoxidase

1BT3345111.6744.3522.282394L-3-hydroxyacyl-CoAdehydrogenase

1F14

310121.5837.0052.234025L-lactatedehydrogenase1LLC

325

135.41

42.027

2.14852

6

Glyceraldehyde-3-phosphate

dehydrogenase

1B7G

340127.0844.1061.961117ClassIalcoholdehydrogenases1HSO374131.8948.4042.183268NADPH-FMNoxidoreductase1BKJ240108.9429.5891.979099CHOreductase

1C9W

315

117.01

43.484

2.28239

10

Ferricreductase1I0S16971.7221.4481.9721111

CoenzymeF420H2:

NADP+

Oxidoreductase

1JAX21281.9926.9521.9150412

Oxidoredutase

Laccase1A65540161.5666.2612.1391813AcetyltransferaseA

1QSR162

74.16

23.264

2.12396

14

DNA-(cytosineN4methyltransferasepvuII

1BOO323116.5738.1232.0594715Glutathionetransferase

1FW1

216

83.96

27.557

2.06875

16

Rhodanese2ORA296112.5338.8212.2138617α-Ketoaciddehydrogenasekinase1GKX

388136.6942.1982.2727218Adenylatekinaseisoenzyme-21AK223399.4728.0382.01883192-Amino-3-ketobutyrateCoAligase1FC4401156.5851.0732.1016420DNApolymeraseI1KTQ543215.9972.6332.1306721α-Amylase(porcinepancreatic1PIF496151.4565.5772.2069622DNApolymeraseII

1BPD

335

147.88

41.970

1.96490

23

Thermal-StableThymidylateSynthase1BSP

278115.3938.4442.1534624

Transferas

GlycogenSynthaseKinase31I09420143.0145.0582.0761425β-Amylase(soybean

1BYC

495

155.82

67.667

2.10323

26

Glucoamylase1KUM10846.7512.4472.1156127Endoglucanase1A3H30095.3239.6632.1722628

CellobiohydrolaseII2BVW362116.1449.3912.2332029β-Glucosidase

1GNX

479140.67

59.245

2.21870

30

Xylanase1BG430290.7639.7532.0734631

β-Mannanase(Thermomonosporafusca1BQC

30291.8938.6742.2090232β-Mannanase(TrichodermaReesei1QNR344115.4746.7812.2112733RibonucleaseA

1AFU

12455.22

15.032

2.00528

34

ExonucleaseIII(EscherichiaColi1AKO268104.0736.6732.1546635

β-Trypsin-detergentcomplexes(porcine1FN6223

81.8126.4212.2075236

Elastase1LVY24097.8128.3902.0469937

Chymotrypsin4CHA24587.1829.3912.2131338Pepsin4PEP326123.0638.5862.1302639

HIV-1Protease

1ODW

99

51.83

12.423

2.05610

40

Hydrolase

Lysozyme1IY313063.6414.9662.1245541

1146

化学学报Vol.68,2010

续表

ProteinsPDBIDThenumberofresiduesAccessible

surfacearea/nm2

Volume/nm3

Fractal

dimensionDf

No.Papain9PAP21279.5329.0312.0861642β-Trypsin5PTP22375.6827.5892.1861943

TrypsinIV(HumanBrain1H4W22477.6128.7772.2912844SubtilisinCarlsberg

1SBC

274

82.08

32.001

2.14455

45

Thermolysin1KEI316103.7240.7442.2112746

Antichymotrypsin1AS4

341140.9745.3122.1101647Carboxypeptidase1LBU21375.7525.7802.1277548

MethionineAminopeptidase1BN5478133.2747.2042.2524349HaloalkaneDehalogenase1BN6249100.2339.7102.0414950

CarboxypeptidaseA

1YME209102.5140.5822.2061151PurpleAidPhosphatase(RatBone1QHW327105.9140.7972.3285652LipaseB

1LBS

317

98.41

39.389

2.21910

53

Hyaluronidase1FCU

350127.4945.2912.2333554

Endo-PolygalacturonaseII1CZF362102.3940.5681.9954855OrotidineMonophosphateDecarboxylase

1DV722783.5927.2932.1737356PectateLyase

1BN8

420

130.09

51.318

2.15346

57

NH3-dependentNAD+synthetase1NSY

271119.5237.0761.9117758Lyase

Carbonicnanhydraseisozymes2CAB26093.4932.8872.3693859GlutamateRacemase1B74254101.3332.8812.0986560IsomerasePhosphoglycerateMutase

1E58

249

98.34

33.380

2.18952

61

GlycogenSynthaseKinase3β1H8F352146.5447.3871.9958962Ligase

BiotinCarboxylase1DV1449156.2157.3132.0618563OuterMembraneProteinX(EscherichiaColi

1QJ914866.4218.8391.8324964OdorantBindingProtein

1OBP

15986.6420.9381.9023465Membraneprotein

MatrixPorinOuterMembraneProteinF2OMF340144.7944.4081.9428166β-lactoglobulin(Pig1EXS16076.9720.6642.0918267β-lactoglobulin(Bovine1CJ516271.7720.0792.0902168ScallopMyosin1KK7537198.2373.2192.1342069Hemoglobin(Bovine1G08572210.3877.6382.2132770NiβHemeHumanHemoglobin1DKE574209.4078.4522.2019871

Globulin

SerumAlbumin(Human

1AO6

585

252.18

77.294

2.21117

72

3.3维数本质

表1中列出了模拟蛋白质分子的残基数,可及表面积和分子体积.三项参数中表面积和体积与残基数基本上成正比,而分形维数Df则不同,很多残基数较大的分子Df值反而小于残基数较少的分子,这证明蛋白质分子并不是简单的肽段堆积,肽链必定具有独特的空间结构;从另一个角度分析,相对于残基数、可及表面积和体积这些宏观参量,分形维数更多的是对蛋白质微观结构的表征[17,18].此外,不同的分形维数具有不同的物理意义,如链维数主要描述蛋白质分子结构域与整体结构

的关系[1,2];关联维数用于刻画蛋白质分子内部原子排列的复杂程度[19];而盒维数表征的是蛋白质分子结构的紧密程度,即盒维数越大,分子结构越紧密,反之亦然.虽然不同方法计算的分形维数Df值不同,但所表达的本质意义近似,即蛋白质分子是一种分形体,具有不规则性、自相似性和内在关联性.3.4维数特点

蛋白质的结构与功能息息相关,结构决定功能,这种作用在酶分子中尤为显著.酶的催化具有很强的高效性和专一性,对于具有同种催化功能的酶分子而言,虽

No.11彭鑫等:

基于盒维数原理计算蛋白质的分形维数1147

然来源、加工手段并不完全相同,所包含的残基数也有差距,但它们有着较为相似的肽段和相似的氢键、二硫键等分子间作用力,导致高级空间结构较为相近,但这种相似性无法通过原子数目、可及表面积和分子体积来表征.例如表1中β-甘露聚糖酶1BQC(Thermomono-sporafuscaβ-Mannanase,第32号与1QNR(Tricho-dermaReeseiβ-Mannanase,第33号的来源、残基数均不同,但具有极为相似的结构,且模拟所得分形维数也非常接近.可见,维数不仅反映了蛋白质的空间结构特点,也可用来表征其功能特性[20,21].

4结论

根据盒维数原理对PDB库中酶蛋白、球蛋白和膜蛋白等72种蛋白质分子进行了分形维数的纯模拟计算,证明了盒维数定量描述蛋白质结构的可行性、合理性与简洁性.模拟所得各类蛋白质分子的分形维数(1,3

f

D∈;Df与残基数的不同步性证明蛋白质分子并不是简单的肽段堆积,而是存在特定的空间结构;Df越大,结构越复杂;同功能酶蛋白具有相近的Df值,故维数既可分析高级结构,也可描述功能特性,是区别于各种宏观参量而对蛋白质微观结构与功能进行表征的有用工具.

References

1Isogai,Y.;Itoh,T.J.Phys.Soc.Jpn.1984,53,2162.

2Wang,C.-X.;Shi,Y.-Y.;Huang,F.-H.Phys.Rev.A1990,

41,7043.

3

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 外语学习 > 日语学习

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1